发布时间:2026-06-19 已有: 位 网友关注
币界网消息,谷歌DeepMind发布了AI控制路线图,旨在针对内部部署的先进AI智能体设计系统级安全框架。该路线图将智能体视为潜在的「内部威胁」,并在系统层面建立起纵深防御。安全系统引入可信AI充当监督智能体,实时监控智能体的推理链、动作与计划,检测到异常或危害企图时直接拦截。该防御机制借鉴了网络安全行业标准的MITRE ATT&CK对抗框架,建立智能体专用的威胁建模系统。开发团队已通过原型系统分析了100万次任务轨迹,实测数据表明,绝大多数被警告的异常并非出于主观恶意,而是源于智能体误解指令或动作过载。