当前位置:主页 > 要闻 > 正文

伯克利团队宣布攻破8个主要智能体评测基准并开源工具

发布时间:2026-04-19 已有: 位 网友关注

  币界网消息,4 月 19 日,伯克利人工智能研究小组转述了Dawn Song的声明,宣布其团队成功攻破了8个主要的智能体评测基准。团队决定开源用于实现这一结果的工具,并将其命名为BenchJack。该工具被描述为“针对评测的渗透测试”,旨在帮助其他开发者主动测试和发现自身评测系统的潜在弱点。

温馨提示:所有理财类资讯内容仅供参考,不作为投资依据。