当前位置:主页 > 动态 > 正文

字节跳动开源2B级扩散语言模型ColaDLM

发布时间:2026-05-16 已有: 位 网友关注

  币界网消息,字节跳动Seed团队开源了名为Cola DLM的2B级连续潜在扩散语言模型。该模型试图绕开传统大语言模型按token从左到右逐个生成的固定路径,改为先组织高层语义,再落回具体文字。Cola DLM的核心是text VAE和block-causal DIT,前者将离散文本映射到连续潜在空间,后者通过flow matching学习潜在先验,最终由条件解码器将潜在变量还原为文本。该模型包含约23亿参数,其中核心DIT为18亿参数,VAE为5亿参数。在多个评测中,论文称其在统一生成式评测协议下已具备与同规模AR / LLADA基线竞争的表现,并在最终平均分上达到最好结果。当前版本仍为研究型checkpoint,未经过指令微调和RLHF,主要用于研究连续潜在扩散如何用于文本生成。

温馨提示:所有理财类资讯内容仅供参考,不作为投资依据。