当前位置:主页 > 头条 > 正文

EpochAI发布Claude偏科图谱:写代码长板一直在,Opus4.6和4.7已补齐数学短板

发布时间:2026-05-16 已有: 位 网友关注

  币界网消息,Epoch AI发布了Claude偏科图谱,显示其在写代码方面表现强劲,但在数学能力上存在短板。最新数据显示,随着Opus 4.6和4.7的发布,这一偏科现象正在快速缓解。根据测算,Claude在软件工程基准测试上的表现一直稳定高于其综合得分,而在数学基准测试上长期存在落差。最新模型已将数学与综合得分的差距缩小至1分以内,补齐了此前的短板。ECI的测算机制比较各大模型之间的相对表现,直接反映特定任务对AI的平均难度,而非对人类的难度。

温馨提示:所有理财类资讯内容仅供参考,不作为投资依据。