当前位置:主页 > 推荐 > 正文

AABriefcase发布:ClaudeFable5夺冠,GLM5.2挤进前三

发布时间:2026-06-19 已有: 位 网友关注

  币界网消息,AA-Briefcase发布称,Claude Fable 5在评测中夺冠,GLM-5.2则挤进前三。评测机构Artificial Analysis推出了首个专为大模型智能体设计的长周期知识工作评测基准,涵盖数据科学、产品管理、银行业务运营及重工业战略四个场景,由谷歌、麦肯锡和波士顿咨询的行业专家开发,共设有91项任务,旨在模拟真实复杂的商业项目流。结果显示,Claude Fable 5取得了最高综合评分,Claude Opus 4.8和GLM-5.2分列第二与第三位。尽管Claude Fable 5表现强劲,但在严格的单项任务全对标准下,完美率仅为3%。在开源模型方面,智谱GLM-5.2表现突出,综合评分仅比Claude Opus 4.8低90分,但运行成本不足其25%。

温馨提示:所有理财类资讯内容仅供参考,不作为投资依据。