中国不只有DeepSeek，阿里除夕夜抛出重磅新模型，是时候整体重估中国AI资产了吗？

发布时间：2025-01-29 已有：位网友关注

　　农历除夕夜，在全球华人喜迎新春之时，纽约证券交易所的电子屏上，阿里巴巴美股股价在收盘前出现显著异动——从涨幅1%快速拉升至6.7%。

　　行情异动的背后，是一场没有硝烟的技术奇袭。

　　1月29日凌晨，阿里通义千问团队悄然上线-Max，在多个权威基准测试中展现出与全球顶级模型比肩的性能。

　　继DeepSeek之后，Qwen2.5-Max的发布是中国AI阵营在高性能、低成本技术路线上的又一重要突破。

　　市场人士分析称，此前过度聚焦DeepSeek，却忽视了包括阿里通义在内的中国AI整体性追赶。行业媒体表示，若阿里Qwen-2.5-max这次的确性能超过V3，可以对其RL推理模型给予更大期待。

　　进一步，当阿里云展现出强大模型+充足算力+完整云平台的组合优势时，是否印证了类似去年北美云计算服务商的投资逻辑？如果美股因AI整体增值10万亿美元，中国AI资产的重估时机是否已至？

　　全面对标全球顶级模型，百万token里程碑

　　Qwen2.5-Max采用超大规模MoE架构，基于超过20万亿token的预训练数据。

　　阿里团队表示，随着后训练技术的不断进步，下一个版本将有望达到更高水平。

　　这些模型使用稀疏注意力，只关注上下文中最重要的部分。这种方法处理百万token输入的速度比传统方法快3到7倍，输出长度可达8000个token。然而，这需要模型识别上下文文档中的关键段落——这是当前语言模型经常难以完成的任务。

　　在测试中，14B型号和Qwen2.5-Turbo在查找非常长的文档中的隐藏数字时都达到了完美的准确性。较小的7B型号也表现良好，只有轻微的错误。

　　在RULER、LV-Eval和LongbenchChat等要求更高的复杂的上下文测试中，百万token模型的表现优于128K token模型，尤其是在超过64K token的序列中，14B型号甚至在RULER中得分超过90分——这是Qwen系列的第一次——在多个数据集上持续击败gpt - 4o mini。

　　是时候整体重估中国AI资产了吗？

　　如果说DeepSeek V3的横空出世展现了中国AI的锐度，那么本次阿里的突破则体现了产业生态的深度进化。

　　在Qwen2.5-Max发布当天，阿里云百炼平台同步开放了完整的工具链支持，开发者可以直接在云端调用。这种超算集群+开源生态+云原生的三位一体架构，与北美AWS、Azure、GCP三大云服务商的商业模式形成镜像。

　　此外，根据我们之前提到的摩根士丹利最新研报，低成本高性能模型也将重塑数据中心和软件行业格局：

　　如果阿里Qwen-2.5-max的性能确实展现出预期水平，加之其低成本优势与完整云生态，或引发DeepSeek之后的中国AI资产新一轮重估。

上一篇：一直游到海水变蓝蛇年新春献词

下一篇：游戏巨头育碧将为TheSandbox推出基于其首款链游的NFT头像

温馨提示：所有理财类资讯内容仅供参考，不作为投资依据。

中国不只有DeepSeek，阿里除夕夜抛出重磅新模型，是时候整体重估中国AI资产了吗？

推荐

热门