当前位置:主页 > 业界 > 正文

AI进入“按量付费与算力配给”时代--Anthropic和DeepSeek告诉我们的事

发布时间:2026-05-23 已有: 位 网友关注

  Anthropic在一轮融资中向投资者展示的预测:公司一季度营收48亿美元,二季度预计升至109亿美元,6月当季有望实现5.59亿美元运营利润。此外,Anthropic一季度每赚1美元,Anthropic要在算力上花71美分;到二季度,这个比例预计降到56美分。去年它给投资者的口径还是至少要到2028年才可能实现全年盈利,眼下利润表先动了。推动这一轮变化的,是企业客户对Claude编程工具和智能体能力的需求。

  需求暴涨的同时,AI的收费方式已经变了。

  知名科技投资者Gavin Baker用了一句很形象的话来概括这件事:AI正在从“all you can eat”走向“pay by the drink”。他谈的是企业真实的使用场景:一个人同时放出几十个、上百个智能体,去跑代码、检索、分析和多步骤推理,平价包月越来越难覆盖背后的真实消耗。

  对于企业,模型选择已经从工程偏好变成财务决策,最便宜和最昂贵的前沿模型之间,价格差可以拉到几十倍甚至上百倍。

  供给侧也没给行业太多缓冲。桥水联合首席投资官Greg Jensen在一场访谈里说,现在世界上唯一比算力供应增长更快的,是算力需求;配给已经开始发生,方式包括提价、限制访问权限,甚至实验室内部暂停部分研究项目。算力、电力、存储和机架系统还在紧绷状态里,按量收费和访问限制开始同时出现,并不意外。

  这背后是对市场最重要的命题:在“铲子”拿走了所有利润后,AI交易下一阶段是什么?

  对此,高盛和SemiAnalysis有明显的分歧。高盛分析师James Covello盯着的是第一阶段的分账方式:过去两年最确定的一轮利润先留在了芯片、HBM、先进封装、数据中心和电力这些上游环节,云厂商先把资本开支背在自己账上,企业端ROI还没有大面积写进利润表。SemiAnalysis看的则是另一头:token已经不只是问答成本,代码、研究、建模、图表、财报分析这些工作,开始把token当成生产资料;如果高价值任务愿意为更强模型付费,缓存命中率、推理优化和硬件迭代又在持续压低单位成本,模型实验室这一层就会从烧钱层往利润层挪。

  Anthropic的盈利说明顶尖模型厂并不只是在讲增长故事,代码、长链路智能体、复杂推理这些高价值任务,已经开始把收入和成本结构一起往前推。高盛原来最担心的是下游利润表还不够扎实,Anthropic至少给出了一个明确信号:在最前沿的那部分任务里,高价值token已经可以做出利润。

  但Anthropic不是模型层的全部。

  5月22日,DeepSeek宣布把V4-Pro API原本75%的折扣永久化。促销结束后,V4-Pro正式按原价四分之一计费:未缓存输入0.435美元/百万token,输出0.87美元;V4-Flash更低,分别是0.14美元和0.28美元。缓存命中价格也被一起压下去。报道特别提到,这种价格对agent、编程助手、客服和文档类工作流尤其敏感,因为这些场景天然依赖重复上下文和缓存。DeepSeek给开发者摆出来的也不是一个单一低价模型,而是一套更适合路由的产品梯度:Flash处理廉价日常负载,Pro处理更复杂的agent coding、长文档推理和高价值自动化任务。

  Anthropic代表的是美国顶尖模型厂的路径:先守住最难、最值钱、最敏感的任务,再让高端工作流去证明模型溢价。它争的是能力密度,是企业愿不愿意为更强的推理、更长的链路、更稳定的结果付更高价格。

  DeepSeek更像另一条路。它没有去同样的高溢价闭源逻辑,而是把单位调用成本、产品层级和缓存友好度尽量做到更适合大规模部署。对很多应用来说,价格不再只是省下一点预算,而是决定某个功能能不能成立、某条工作流能不能跑进生产环境。

  放到高盛和SemiAnalysis的争论里,这两家公司各自回答了问题的一半。

  Anthropic证明的是,高价值token能赚钱。DeepSeek证明的是,低成本token能放量。前者抬高单次调用的经济价值,后者把总调用量的边界往外推。高盛最担心的,是下游赚不到足够多的钱,最后供不起上游已经吃到的利润和资本开支;Anthropic和DeepSeek同时出现以后,这个判断就不一样了。模型层开始出现两条不同的经营路径,而且两条路都在把蛋糕往外做。

  这对上游是更偏正面的信号。原因并不复杂。Anthropic这条路证明,高价值工作负载愿意为更强模型买单;DeepSeek这条路证明,价格降到一定程度之后,大量原本做不通的调用会被放出来。只要算力和基础设施仍处在供给偏紧的状态里,上游吃到的就不只是“稀缺溢价”,还会叠加一层更大的总需求。Greg Jensen说的“配给”没有结束,反而让这件事更清楚:高价值token和低成本token都在长,供给约束还在,上游很难立刻退场。

  变化更大的,可能是中间层。

  当模型层不再只有一种玩法,企业真正要买的就不只是单一模型,而是调度能力:什么任务走Anthropic,什么任务走DeepSeek Flash,什么任务走DeepSeek Pro,什么任务需要高合规体系,什么任务可以大量缓存,什么任务该在高低配之间动态切换。模型分层越明显,路由、编排、工作流入口和预算控制就越值钱。

  高盛的担心也没有消失。Anthropic证明的是顶尖模型厂在高价值场景里可以更早赚钱,DeepSeek证明的是低价会让更多产品成立,这两件事还不等于普通企业已经把AI成本稳定地变成利润表里的回报。DeepSeek自己的低价策略,也伴随着利润压力。这是一种用利润换触达、用规模换平台使用习惯的打法,能不能跑通,还要看架构效率、资金续航、开发者采用能不能沉淀成稳定平台使用,以及地缘和合规限制会不会拖慢全球企业渗透。

  不过,市场的主问题已经变了。它不再只是问“谁卖铲子”,也不再只是问“模型厂什么时候才会赚钱”。Anthropic和DeepSeek把模型层拆成了两条路:一条把单个token做贵,一条把token总量做大。只要这两条路不是孤例,SemiAnalysis关于“利润池仍在扩张”的判断,就会比高盛那套“上游先赚满、下游供养不足”的框架更接近现实。上游还有空间,靠的已经不只是稀缺,也包括下游第一次开始用两种不同方式,把这门生意做大。

  接下来几个季度,财报里最值得盯的会是几类数字:Anthropic这类高端模型的收入质量和毛利改善能不能延续,DeepSeek这类低价路线能不能把开发者采用变成稳定调用量,云厂商的资本开支能不能更顺畅地转进收入和合同,上游的内存、算力和机架瓶颈会不会继续把需求往前挤。

温馨提示:所有理财类资讯内容仅供参考,不作为投资依据。