找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 15|回复: 0

多智能体系统中安全可信的代理式人工智能的哨兵代理

[复制链接]

334

主题

0

回帖

1027

积分

金牌会员

积分
1027
发表于 2025-9-21 15:08:18 | 显示全部楼层 |阅读模式
摘要: 本文提出了一个新颖的架构框架,旨在增强多智能体系统(MAS)中的安全性和可靠性。该框架的一个核心组成部分是Sentinel Agents网络,作为一个分布式安全层,集成了诸如大型语言模型(LLMs)的语义分析、行为分析、检索增强验证和跨智能体异常检测等技术。这些代理可以潜在地监督智能体之间的通信,识别潜在威胁,执行隐私和访问控制,并保持全面的审计记录。与Sentinel Agents的概念互补的是协调Agent的使用。协调Agent监督政策实施,并管理智能体的参与。此外,协调Agent还从Sentinel Agents那里接收警报。基于这些警报,它可以调整政策,隔离或隔离行为不端的代理,并遏制威胁,以维护MAS生态系统的完整性。这种双层安全方法将Sentinel Agents的持续监控与协调Agent的治理功能相结合,支持对各种威胁的动态和适应性防御机制,包括及时注入、串谋代理行为、LLMs生成的幻觉、隐私泄露和协同多智能体攻击。除了架构设计,我们还展示了一个仿真研究,其中将162种不同家族(及时注入、幻觉和数据外泄)的合成攻击注入到一个多智能体对话环境中。Sentinel Agents成功检测到了攻击尝试,证实了所提出的监控方法的实际可行性。该框架还提供了增强的系统可观测性,支持合规性,并实现随时间的政策演变。
更新时间: 2025-09-18 13:39:59
领域: cs.AI,cs.MA

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2025-11-1 15:16 , Processed in 0.070451 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表