阶跃上线StepAudio2.5ASR：引入MTP机制提速，32K窗口根治转写断片

发布时间：2026-04-24 已有：位网友关注

　　币界网消息，阶跃星辰发布新一代自动语音识别模型StepAudio 2.5 ASR，目前已全量上线其开放平台。该版本率先将大语言模型的多token预测技术引入语音识别领域，在大幅提升推理速度的同时，复用大模型32K上下文窗口，打破了传统长音频转写需要切片拼接的限制。新模型通过直接复用32K上下文窗口，支持端到端单次读入最长30分钟完整音频。在30分钟满载输入测试中，模型未出现随时间推移精度衰减的情况，其在Librispeech等中英文10个权威开源测试集上的综合错误率均低于竞品。