AI进入“按量付费与算力配给”时代--Anthropic和DeepSeek告诉我们的事

发布时间：2026-05-23 已有：位网友关注

　　Anthropic在一轮融资中向投资者展示的预测：公司一季度营收48亿美元，二季度预计升至109亿美元，6月当季有望实现5.59亿美元运营利润。此外，Anthropic一季度每赚1美元，Anthropic要在算力上花71美分；到二季度，这个比例预计降到56美分。去年它给投资者的口径还是至少要到2028年才可能实现全年盈利，眼下利润表先动了。推动这一轮变化的，是企业客户对Claude编程工具和智能体能力的需求。

　　需求暴涨的同时，AI的收费方式已经变了。

　　知名科技投资者Gavin Baker用了一句很形象的话来概括这件事：AI正在从“all you can eat”走向“pay by the drink”。他谈的是企业真实的使用场景：一个人同时放出几十个、上百个智能体，去跑代码、检索、分析和多步骤推理，平价包月越来越难覆盖背后的真实消耗。

　　对于企业，模型选择已经从工程偏好变成财务决策，最便宜和最昂贵的前沿模型之间，价格差可以拉到几十倍甚至上百倍。

　　供给侧也没给行业太多缓冲。桥水联合首席投资官Greg Jensen在一场访谈里说，现在世界上唯一比算力供应增长更快的，是算力需求；配给已经开始发生，方式包括提价、限制访问权限，甚至实验室内部暂停部分研究项目。算力、电力、存储和机架系统还在紧绷状态里，按量收费和访问限制开始同时出现，并不意外。

　　这背后是对市场最重要的命题：在“铲子”拿走了所有利润后，AI交易下一阶段是什么？

　　对此，高盛和SemiAnalysis有明显的分歧。高盛分析师James Covello盯着的是第一阶段的分账方式：过去两年最确定的一轮利润先留在了芯片、HBM、先进封装、数据中心和电力这些上游环节，云厂商先把资本开支背在自己账上，企业端ROI还没有大面积写进利润表。SemiAnalysis看的则是另一头：token已经不只是问答成本，代码、研究、建模、图表、财报分析这些工作，开始把token当成生产资料；如果高价值任务愿意为更强模型付费，缓存命中率、推理优化和硬件迭代又在持续压低单位成本，模型实验室这一层就会从烧钱层往利润层挪。

　　Anthropic的盈利说明顶尖模型厂并不只是在讲增长故事，代码、长链路智能体、复杂推理这些高价值任务，已经开始把收入和成本结构一起往前推。高盛原来最担心的是下游利润表还不够扎实，Anthropic至少给出了一个明确信号：在最前沿的那部分任务里，高价值token已经可以做出利润。

　　但Anthropic不是模型层的全部。

　　5月22日，DeepSeek宣布把V4-Pro API原本75%的折扣永久化。促销结束后，V4-Pro正式按原价四分之一计费：未缓存输入0.435美元/百万token，输出0.87美元；V4-Flash更低，分别是0.14美元和0.28美元。缓存命中价格也被一起压下去。报道特别提到，这种价格对agent、编程助手、客服和文档类工作流尤其敏感，因为这些场景天然依赖重复上下文和缓存。DeepSeek给开发者摆出来的也不是一个单一低价模型，而是一套更适合路由的产品梯度：Flash处理廉价日常负载，Pro处理更复杂的agent coding、长文档推理和高价值自动化任务。

　　Anthropic代表的是美国顶尖模型厂的路径：先守住最难、最值钱、最敏感的任务，再让高端工作流去证明模型溢价。它争的是能力密度，是企业愿不愿意为更强的推理、更长的链路、更稳定的结果付更高价格。

　　DeepSeek更像另一条路。它没有去同样的高溢价闭源逻辑，而是把单位调用成本、产品层级和缓存友好度尽量做到更适合大规模部署。对很多应用来说，价格不再只是省下一点预算，而是决定某个功能能不能成立、某条工作流能不能跑进生产环境。

　　放到高盛和SemiAnalysis的争论里，这两家公司各自回答了问题的一半。

　　Anthropic证明的是，高价值token能赚钱。DeepSeek证明的是，低成本token能放量。前者抬高单次调用的经济价值，后者把总调用量的边界往外推。高盛最担心的，是下游赚不到足够多的钱，最后供不起上游已经吃到的利润和资本开支；Anthropic和DeepSeek同时出现以后，这个判断就不一样了。模型层开始出现两条不同的经营路径，而且两条路都在把蛋糕往外做。

　　这对上游是更偏正面的信号。原因并不复杂。Anthropic这条路证明，高价值工作负载愿意为更强模型买单；DeepSeek这条路证明，价格降到一定程度之后，大量原本做不通的调用会被放出来。只要算力和基础设施仍处在供给偏紧的状态里，上游吃到的就不只是“稀缺溢价”，还会叠加一层更大的总需求。Greg Jensen说的“配给”没有结束，反而让这件事更清楚：高价值token和低成本token都在长，供给约束还在，上游很难立刻退场。

　　变化更大的，可能是中间层。

　　当模型层不再只有一种玩法，企业真正要买的就不只是单一模型，而是调度能力：什么任务走Anthropic，什么任务走DeepSeek Flash，什么任务走DeepSeek Pro，什么任务需要高合规体系，什么任务可以大量缓存，什么任务该在高低配之间动态切换。模型分层越明显，路由、编排、工作流入口和预算控制就越值钱。

　　高盛的担心也没有消失。Anthropic证明的是顶尖模型厂在高价值场景里可以更早赚钱，DeepSeek证明的是低价会让更多产品成立，这两件事还不等于普通企业已经把AI成本稳定地变成利润表里的回报。DeepSeek自己的低价策略，也伴随着利润压力。这是一种用利润换触达、用规模换平台使用习惯的打法，能不能跑通，还要看架构效率、资金续航、开发者采用能不能沉淀成稳定平台使用，以及地缘和合规限制会不会拖慢全球企业渗透。

　　不过，市场的主问题已经变了。它不再只是问“谁卖铲子”，也不再只是问“模型厂什么时候才会赚钱”。Anthropic和DeepSeek把模型层拆成了两条路：一条把单个token做贵，一条把token总量做大。只要这两条路不是孤例，SemiAnalysis关于“利润池仍在扩张”的判断，就会比高盛那套“上游先赚满、下游供养不足”的框架更接近现实。上游还有空间，靠的已经不只是稀缺，也包括下游第一次开始用两种不同方式，把这门生意做大。

　　接下来几个季度，财报里最值得盯的会是几类数字：Anthropic这类高端模型的收入质量和毛利改善能不能延续，DeepSeek这类低价路线能不能把开发者采用变成稳定调用量，云厂商的资本开支能不能更顺畅地转进收入和合同，上游的内存、算力和机架瓶颈会不会继续把需求往前挤。

上一篇：Uniswap创始人HaydenAdams：协议费用机制扩展至9条区块链

下一篇：美股和美债的“矛盾走势”，接下来谁会赢？

温馨提示：所有理财类资讯内容仅供参考，不作为投资依据。

AI进入“按量付费与算力配给”时代--Anthropic和DeepSeek告诉我们的事

推荐

热门