发布时间:2026-04-19 已有: 位 网友关注
纳斯达克互联网泡沫巅峰时刻的2000年1月,被视为最大网络服务商的美国在线亿美元的市值,反向收购了时代华纳。
美国在线没有多少利润,但有不断膨胀的用户数和一轮接一轮涌入的资本。时代华纳有现金流、有内容、有基础设施,但在市场眼里,它是一家旧时代公司。
收购完成的2年后,合并实体却录得史上最大的987亿美元亏损纪录。美国在线的用户增长神话碎裂,拨号上网被宽带取代,赖以为生的订阅收入和广告收入同时塌缩。
26年后,一场结构高度相似的命运分岔正在加速递归的AI行业上演。
这是这家公司成立以来第一次在收入维度反超对手。15个月前,它的年化收入还只有10亿美元。
同一时间,OpenAI正在为一场可能在今年四季度进行的IPO做准备。它刚刚关闭了硅谷史上最大的1220亿美元私募融资,估值达到8520亿,但同时预计2026年亏损140亿美元,现金流转正的时间被推迟到了2030年。
一个造血能力在加速增强,一个在输血需求却在悄然上升。
两条截然迥异的AI发展路线,或许从创始人离开彼此那一天就已经注定。
OpenAI的扩张速度在商业史上很难找到参照物。
2024年底年化收入37亿美元,2025年底翻到200亿,2026年2月到达250亿。山姆·奥特曼对投资者的承诺是2030年收入达到2800亿美元。为了支撑这个叙事,OpenAI在过去一年签下了包括微软、亚马逊、甲骨文等在内的超过5000亿美元的云计算合约。
这些数字的另一面是Open AI在2025年上半年的研发支出就达67亿美元,股权激励近25亿美元。2025全年现金消耗约85亿美元。2026年,仅推理成本一项预计就将达到141亿,比2025年增长68%。公司预计2026年全年亏损140亿美元,2027年现金消耗将飙升至570亿。
作为CFO的萨拉・弗莱尔在公司内部坦承了这一现实,她与奥特曼在IPO时机上产生了分歧,弗莱尔认为公司应当先建立更稳固的财务基础,而奥特曼将IPO视为筹集基础设施资金的工具。
OpenAI背后还藏有一项潜在的财务义务,即每一美元收入中,20%要以分成形式支付给微软,这一安排延续至2032年。2026和2027两年,OpenAI预计将向微软支付超过130亿美元的收入分成。
今年3月,寿终正寝的Sora可能就是奥特曼执念于延长战线的结果。
从预览效果最早震动业界,到后来与迪士尼达成合作,Sora一度成为AI领域最被看重的明星项目,但据调查,Sora的全球用户在突破100万后迅速回落至不到50万。每天运营成本约100万美元。每一个生成的用户都在消耗有限的GPU资源。
2025年12月2日,奥特曼向全公司发出CodeRed备忘录,要求将资源从广告、健康、购物等多条战线回撤,全力改善ChatGPT。并在备忘录中直言:
公司正处于ChatGPT的关键时刻。广告计划搁置,Agent开发延期,一个名为Pulse的个性化助手项目暂停。
3个多月后的2026年3月24日,OpenAI正式决定关闭Sora,而迪士尼都是在公告发出前不到一个小时才得知消息的。
与多面作战的Open AI不同,Anthropic表现出了另一种增长逻辑。
2024年12月还是10亿美元的年化收入,2025年中就已到达约47亿,年底到达90亿。2026年2月,达到了140亿;3-4月分别达到190亿和300亿,对Open AI实现了反超。
15个月的30倍速度,在企业软件历史上几乎没有先例。
增长的核心驱动并非来自C端的用户订阅,而是企业API调用,其中80%收入来自商业客户。截至2026年4月,超过1000家企业每年在Claude上的支出超过100万美元,而财富10强中有8家是Claude的客户。
作为核心产品的Claude Code,这个2025年5月才公开发布的编程工具目前年化收入已超过25亿美元,自2026年初以来翻了一倍以上。它在AI编程的份额达到54%,远超GitHub Copilot和Cursor。目前全球4%的公开GitHub提交由Claude Code完成,预计年底将达到20%以上。
这里存在着一个关键的效率差异:Anthropic每月活跃用户的变现能力约为211美元,OpenAI约为25美元。前者是后者的8倍。用户量小得多,单位变现效率高得多。
更重要的是成本端。OpenAI到2030年的年训练成本预计达到1250亿美元,Anthropic约为300亿。同一场竞赛,4倍的成本差距。Anthropic预计2027年实现自由现金流为正,OpenAI则将盈亏平衡推到了2029年甚至2030年。
两条不同AI路径背后,存在一个与AI企业创始人背景密切相关的根本性差异:达里奥・阿莫迪他和几乎所有其他AI公司的掌舵者都不一样。
奥特曼是硅谷创投机构YC前总裁,一个职业投资人和公司运营者。DeepMind的哈萨比斯是神经科学家出身,但背后是Alphabet的组织机器,扎克伯格在哈佛宿舍里写网站出身,AI只是Meta的一条业务线。
在看国内,字节梁汝波、阿里吴泳铭、百度李彦宏大多是互联网企业家,AI对他们而言更多是重要的商业增长引擎。
阿莫迪是物理学家和计算神经科学家出身,普林斯顿的博士论文研究的是大规模神经电生理,即用电极记录真实的神经回路如何集体运作。
博士毕业后,他在斯坦福医学院做博士后,把机器学习应用于生物医学数据,然后去了百度和Google Brain做研究,直到2016年加入OpenAI并成长为研究副总裁,直接领导了GPT-2和GPT-3的开发,同时也是RLHF的共同发明人和Scaling Laws的核心实践者。
这份履历决定了它的纯度。阿莫迪在正式创办公司之前,做了近十五年的一线研究,这让他更像是一个被迫学习商业的科学家。
这种背景决定了两件事。
第一,他清楚地知道AI现在能做什么、不能做什么。
在一档播客中,他这样描述能力曲线:如果你把到目前为止的曲线做一个外推,去年我们在本科水平,前年在高中生水平,现在开始接近博士水平……这确实让你觉得2026或2027可以到达AGI。但他紧接着说:仍然存在100年也达到不了的可能,只是概率在迅速降低。一个真正懂技术的人,会同时持有乐观和不确定性。
第二,他知道AI现阶段最先能在哪里创造线月,在Anthropic首次开发者大会Code with Claude上,他被问及幻觉问题时说:这取决于你怎么衡量,但我怀疑AI模型产生幻觉的频率可能比人类低,只是幻觉的方式更令人意外。
一个研究了十五年神经回路的人,对模型能力的边界有一种肌肉记忆式的感知。他不会因为Demo效果炸裂就急着推向市场,也不会因为投资人期待就去铺一条全模态的产品线。
这解释了Anthropic为什么没有去碰图像生成、生成、引擎、社交App这些方向。
或许阿莫迪深知,在当前模型能力的真实边界内,这些方向要么无法产生稳定的商业价值,要么会消耗大量算力却无法转化为付费收入。
他选择把所有资源集中在文本、代码和Agent上。
这些场景的共同特征是:AI的输出可以被精确衡量,可以直接替换人工,客户愿意为可计量的生产力提升买单。
AI带来的威胁来自多个方向,减轻某些危险可能会使其他危险恶化——如果我们不能极其谨慎地穿过这根针眼的话。
其列举的风险正是技术本身失控的风险。
OpenAI的失焦不是2025年才开始的。它的根源可以追溯到微软130亿美元投资落地之后。
毕竟拿了钱,很多事就不由自己决定了。
这或许也是梁文锋一开始拒绝DeepSeek快速商业化和不追求融资的深层逻辑。
即使股东不是短视之辈,也倾向于以行业都关注的参数来审视投入回报。当GPT-4在2023年遥遥领先时,以闭源防御、以加速商业化进攻,成为OpenAI的默认策略。订阅、API、Agent、打入iPhone供应链,大干快上。
代价首先体现在算力分配上。
2024年5月,OpenAI对齐团队负责人Jan Leike辞职并加入Anthropic。彼时他坦言,过去几年里,OpenAI安全文化和流程已经让位于“闪亮产品”。他还透露团队一直在为获取算力而挣扎,但那些本该用于关键研究的计算资源越来越难争取到。
之后的人才流失如同多米诺骨牌。
作为前CTO的MiraMurati离职创业并从OpenAI招走大量核心人才。研究主管安德烈・卡帕西离开。多位关键研究员转投Anthropic、Meta和其他竞争者。
过早的商业化,在相当程度上分散了通往更强模型的精力。这既包括了算力调度的分配,也带来了人才凝聚力上的消耗。
许多顶尖研究者,并不是靠高薪就能留住的,这些人走掉,反而是因为公司方向与他们的探索预期分道扬镳了。
到了奥特曼意识到不对劲的2025年末时,OpenAI在LMArena上已不是第一,企业API市场份额从50%跌至25%,模型能力的相对退步和商业化的过度扩张,几乎是同一枚硬币的两面。
奥特曼的野心可以理解:规模会成为壁垒。只要足够大,足够早,竞争者就没有空间。
关键问题在于,AI不是社交网络、短或者电商,不存在网络效应驱动的赢家通吃逻辑。
每一次推理请求都有真实的GPU成本。用户越多,亏损越大——除非能在每一个场景上都实现足够高的付费转化率。
OpenAI的9亿周活跃用户中,付费订阅只有5000万个。75%的收入依赖订阅。消费侧的单位经济模型远未跑通。企业侧,份额正在被Anthropic蚕食。
有一个被AI叙事长期忽略的反直觉事实:
大模型可能会[*][*]SaaS,但大模型不是SaaS。
传统SaaS的边际成本趋近于零。多一个用户,多一点存储和带宽,成本可以忽略不计。软件的毛利率往往可以达到70%-80%甚至更多。
模型的推理是实打实的算力消耗。
OpenAI的毛利率约为33%。相当于每收入1美元,有67美分花在了GPU上。Anthropic的毛利率约为40%,推理成本比内部预期超出了23%。
在找到高频、刚需、高付费意愿的应用场景之前,用户增长本身就是一个财务黑洞。
规模有可能成为护城河,但同时也会让支出同步攀升。
OpenAI的2025年推理支出已达约84亿美元,预计2026年将增至141亿。它的收入在增长,但成本的增长更快。
企业客户每年花100万美元以上,是因为Claude替代了原来在付费的东西。
Agent路线的核心逻辑是:不卖通用智能,卖自动化劳动。
它让AI完成可计量、可定价、可重复的任务。每一次Agent执行一个工作流,都是一次有明确ROI的交易。
这就解释了为什么Anthropic能在远小于OpenAI的用户规模上,实现更高的收入。它的客户不是在为聊天付费,而是在为生产力替代付费,两件事的单价差是迥然相异的。
Meta的Llama4事件或许是最典型案例。2025年4月,Llama4Maverick以1417的ELO分登上排行榜第二。但社区很快发现,提交给LMArena的是一个专门为对话风格优化的实验版本,回答冗长且充满emoji——这种风格恰好能讨好随机投票者。公开发布的版本在评测中直接跌到了第32-35名。
刷上限许多时候能够成为能力边际的突围,但有些时候只是一种证明自己的行为,是一种赢学。
它既能够让市场中习惯了预期叙事的击鼓传花游戏玩下去,也符合某些大企业的官僚主义和向上汇报文化。
它的受众并非客户,有时只是为了解决投资人焦虑和大企业内部的KPI,在LMArena上排名更高,融资路演的PPT上就多一份素材。
事实上,在国内科技公司的AI竞赛中,一些公司也痴迷于用基准测试或刷榜来证明自己领先,但模型的实际效果与使用率如何,不同用户心中反而有一杆不同于比武结果的秤。
这终究是一条执着于获得融资性现金流乃至市值管理的路径。
与此不同的是,Anthropic的产品逻辑却并不执念于刷榜来自我证明,也不围绕对话讨好度进行工程改造,它集中资源在SWE-benchVerified、Terminal-Bench、OSWorld这类任务评价上。
它们的共同点是,测的不是模型能不能说漂亮话,而是能不能把活干完,这是两件截然不同的事。
Anthropic在发布Opus4.6时,曾精确描述了自己的实现细节:
我们用Claude构建Claude,我们的工程师每天用Claude Code写代码,每个新模型首先在我们自己的工作上测试。
当Replit的CEO说Sonnet4.5把代码
许多时候,口碑和完成度的意义远远胜于跑分,因为跑分更多服务于估值叙事,而口碑才能提高客户留存。
刷上限换来的融资性现金流,把活干完才能换来经营性现金流。
这两种思路的差异,在15个月内制造了从落后到反超的结果。
单就估值而言,目前OpenAI仍然保持着AI领域的领先估值,其以8520亿美元估值对应250亿年化收入,市销率约34倍。Anthropic以3800亿美元估值对应300亿年化收入,市销率约13倍。
一旦增长停滞,一旦新的融资轮无法覆盖旧的亏损,故事就会迅速崩塌。
狂热的早期,融资性现金流可以买来时间和声量,可泡沫褪去之后,唯有经营性现金流能让一家公司活着走出去。