当前位置:主页 > 推荐 > 正文

小米发布重建生成一体化世界模型框架,刷新主流基准性能纪录

发布时间:2026-05-26 已有: 位 网友关注

  币界网消息,小米汽车正式发布重建生成一体化世界模型框架,首次在内部实现三维重建与视频生成模块的深度耦合。在自动驾驶仿真中,传统技术往往将重建与生成割裂。团队提出jointwm架构,以三维几何结构作为物理骨架锚定场景,再通过生成模块补全视觉细节并预测未观测区域,在Waymo和NuScenes等主流基准中刷新多项最佳性能纪录。该架构在H20 GPU上实现单视角0.19秒、三视角0.46秒的生成速度,并支持最长1分钟的视频生成。研究成果已在小米汽车三大场景落地,包括交付超10万段高质量合成数据用于感知模型训练、构建高逼真闭环仿真环境复现长尾路况,以及上线辅助驾驶学堂以生成式视频指导用户操作。

温馨提示:所有理财类资讯内容仅供参考,不作为投资依据。