发布时间:2026-05-12 已有: 位 网友关注
币界网消息,人工智能分析平台发布了首个编码智能体综合基准指数。该指数综合了代码生成、终端操作和技术问答三项测试,用来评估AI程序员的真实工程表现。首期评测中,Cursor CLI搭配Opus 4.7模型以61分拿下榜首,以1分优势力压OpenAI的Codex和Anthropic的Claude Code。同样调用Opus 4.7模型,Cursor CLI的得分略高于官方的Claude Code,但代价是单次任务平均耗时更长,API调用成本也更高。最省钱的是Cursor内置的Composer 2,单次任务只要0.07美元DeepSeek V4 Pro和Kimi K2.6紧随其后,但这几款国产模型跑起来耗时明显更长。