发布时间:2025-01-29 已有: 位 网友关注
农历除夕夜,在全球华人喜迎新春之时,纽约证券交易所的电子屏上,阿里巴巴美股股价在收盘前出现显著异动——从涨幅1%快速拉升至6.7%。
行情异动的背后,是一场没有硝烟的技术奇袭。
1月29日凌晨,阿里通义千问团队悄然上线-Max,在多个权威基准测试中展现出与全球顶级模型比肩的性能。
继DeepSeek之后,Qwen2.5-Max的发布是中国AI阵营在高性能、低成本技术路线上的又一重要突破。
市场人士分析称,此前过度聚焦DeepSeek,却忽视了包括阿里通义在内的中国AI整体性追赶。行业媒体表示,若阿里Qwen-2.5-max这次的确性能超过V3,可以对其RL推理模型给予更大期待。
进一步,当阿里云展现出强大模型+充足算力+完整云平台的组合优势时,是否印证了类似去年北美云计算服务商的投资逻辑?如果美股因AI整体增值10万亿美元,中国AI资产的重估时机是否已至?
全面对标全球顶级模型,百万token里程碑
Qwen2.5-Max采用超大规模MoE架构,基于超过20万亿token的预训练数据。
阿里团队表示,随着后训练技术的不断进步,下一个版本将有望达到更高水平。
这些模型使用稀疏注意力,只关注上下文中最重要的部分。这种方法处理百万token输入的速度比传统方法快3到7倍,输出长度可达8000个token。然而,这需要模型识别上下文文档中的关键段落——这是当前语言模型经常难以完成的任务。
在测试中,14B型号和Qwen2.5-Turbo在查找非常长的文档中的隐藏数字时都达到了完美的准确性。较小的7B型号也表现良好,只有轻微的错误。
在RULER、LV-Eval和LongbenchChat等要求更高的复杂的上下文测试中,百万token模型的表现优于128K token模型,尤其是在超过64K token的序列中,14B型号甚至在RULER中得分超过90分——这是Qwen系列的第一次——在多个数据集上持续击败gpt - 4o mini。
是时候整体重估中国AI资产了吗?
如果说DeepSeek V3的横空出世展现了中国AI的锐度,那么本次阿里的突破则体现了产业生态的深度进化。
在Qwen2.5-Max发布当天,阿里云百炼平台同步开放了完整的工具链支持,开发者可以直接在云端调用。这种超算集群+开源生态+云原生的三位一体架构,与北美AWS、Azure、GCP三大云服务商的商业模式形成镜像。
此外,根据我们之前提到的摩根士丹利最新研报,低成本高性能模型也将重塑数据中心和软件行业格局:
如果阿里Qwen-2.5-max的性能确实展现出预期水平,加之其低成本优势与完整云生态,或引发DeepSeek之后的中国AI资产新一轮重估。