当前位置:主页 > 业界 > 正文

复旦联合美团LongCat开源交互式世界模型基准WBench

发布时间:2026-05-28 已有: 位 网友关注

  币界网消息,复旦大学与美团LongCat团队联合开源交互式世界模型基准WBench,评估视频生成在物理规则、时空一致与交互控制的底层建模能力。该基准包含289个测试用例与1058轮交互,涵盖第一与第三人称双视角,整合导航控制、主体动作、事件编辑与视角切换。评估体系包含22个自动指标,打分结果与人类盲测胜率的Spearman秩相关系数至少达到0.94。测试表明,相较于趋于饱和的视频质量,交互控制与模型的渲染、一致性及物理水平几乎解耦。开源世界模型在多个维度领跑,hy-world 1.5取得导航控制最高分,lingbot-world夺得一致性榜首,matrix-game 3.0则在动作导航中位列第一。

温馨提示:所有理财类资讯内容仅供参考,不作为投资依据。