谷歌DeepMind发布AI控制路线图，防范内部威胁

发布时间：2026-06-19 已有：位网友关注

　　币界网消息，谷歌DeepMind发布了AI控制路线图，旨在针对内部部署的先进AI智能体设计系统级安全框架。该路线图将智能体视为潜在的「内部威胁」，并在系统层面建立起纵深防御。安全系统引入可信AI充当监督智能体，实时监控智能体的推理链、动作与计划，检测到异常或危害企图时直接拦截。该防御机制借鉴了网络安全行业标准的MITRE ATT&CK对抗框架，建立智能体专用的威胁建模系统。开发团队已通过原型系统分析了100万次任务轨迹，实测数据表明，绝大多数被警告的异常并非出于主观恶意，而是源于智能体误解指令或动作过载。