当前位置:主页 > 热点 > 正文

罗福莉:大模型迈入后训练时代,顶尖团队预训练与后训练算力比达1:1

发布时间:2026-04-24 已有: 位 网友关注

  币界网消息,罗福莉表示,大模型竞争已从预训练主导的chat时代,全面转向后训练主导的agent时代。当前的核心赛点是如何在agent上做好强化学习的scaling。她透露,在chat时代,用于研究、预训练和后训练的算力比例约为3:5:1而在如今的agent时代,合理的算力分配比例变为3:1:1,即预训练与后训练的算力投入已基本相当,目前顶尖模型团队在这两项的投入比例已达到1:1。同时,系统架构的要求也发生巨变,过去的强化学习基础设施主要以模型推理引擎为核心,处理纯文本演算现在的基建必须以agent为核心,支持异构集群调度,并能容忍agent在复杂工作流中因各类不可控因素中断的模糊性。

温馨提示:所有理财类资讯内容仅供参考,不作为投资依据。