发布时间:2026-05-13 已有: 位 网友关注
币界网消息,阿里国际数字商业集团开源了最新多模态大模型Ovis2.6-80b-a3b。该版本将语言模型骨干升级为混合专家架构,总参数量达到800亿,但单次推理只需激活约30亿参数。新版本最大的突破是引入了「带图思考」机制,能够主动调用裁剪、旋转等内置视觉工具,对图片的局部区域进行细致分析。这种自我反思式的多轮推理,大幅提升了复杂视觉任务的准确率。此外,Ovis2.6将上下文窗口扩大至64k tokens,并原生支持最高2880×2880分辨率的高清图片输入。结合强化的光学字符识别和图表分析能力,系统可以跨越多页文档收集线索,完成信息密集型业务的问答。通过800亿参数保证认知上限、30亿激活控制运营成本的组合,Ovis2.6提供了一套高性价比的解决方案。