当前位置:主页 > 动态 > 正文

英伟达GTC:AI界春晚,满心期待、扫兴而归?

发布时间:2026-03-17 已有: 位 网友关注

  2026年3月16日,英伟达创始人兼CEO黄仁勋在GTC 2026大会上发表主题演讲,核心议题涵盖CUDA平台20周年、推理拐点与算力需求爆发、Vera Rubin系统架构、Groq集成、OpenClaw代理革命及物理AI与机器人。

  1)数据中心营收展望:2025-2027年数据中心累计收入达到1万亿美元,符合预期。市场主流预期本身已经提升至1万亿美元以上,更期待的是公司能给出明确订单等方面的信息。

  2)性能和成本:在tokens/watt和token速度两个维度上,英伟达均为全球最高性能;英伟达的token成本全球最低。

  3)数据中心成为token工厂:每个工厂受限于功率,需要管理token生产的吞吐量和速度。

  ①Vera Rubin:100%液冷,所有线缆取消,安装时间从两天缩短至两小时;

  ②CPOSpectrum-X交换机:已全面量产,与TSMC共同研发;

  ③CPU:世界上唯一使用LPDDR5的数据中心CPU,独立售卖,将成为数十亿美元级业务;

  ④Vera Rubin:已在Microsoft Azure上线运行。英伟达供应链已可每周生产数千套系统,每月数GW级AI工厂产能;

  技术来自于收购的Groq团队,Groq LP30由三星制造,预计三季度发货。

  解决方案:推出了一个Dynamo软件,把推理步骤分解出来:

  1. 预填充阶段:也称Prefill,也是模型批量处理用户输入的Prompt的阶段,主要是以计算为主,因此在Vera Rubin上完成;

  2. 解码的注意力环节:主要是计算当前产生的token与历史tokens的关系,是计算和存储并重的工作性质,也是在Vera Rubin上完成,频繁读取Rubin上的HBM内存单元。

  3. 解码的前馈网络:在Attention环节确定上下文关系后,前馈网络负责基于前Token来输出下一个Token的概率分布,并选出下一Token,即“吐字”。

  这个环节的每一层都要读取模型的权重参数,读一次只能处理一个Token,原本参数放在HBM中,计算单元一直在等着数据从HBM搬运过来,这也是“内存墙”的真正堵点。

  把解码分成用软件拆出两个阶段后,等于把模型在工作的“上下文记忆”仍然保留在HBM上,但把大部分模型参数转移到了Groq的SRAM上,芯片上内嵌的存储层SRAM能够以极低的延迟读取这些权重参数,从而解决推理吐字慢的问题。

  Rubin和Groq之间用以太网紧密耦合,RDMA特殊连接模式可以让两芯片之间的交互延迟降低约一半。

  虽然英伟达长期看好CPO方案,但客户方面倾向于将铜缆方案用到极致后再切换CPO。

  ①太空数据中心:针对能源不足问题,英伟达宣布Vera Rubin Space-1,计划将数据中心部署到太空;

  代理系统在企业网络中可以访问敏感信息、执行代码、对外通信——这需要企业级安全。英伟达与OpenClaw创始人Peter Steinberger合作推出NemoClaw,集成OpenShell技术,包含网络护栏和隐私路由器,可连接各SaaS公司的策略引擎;

  ③物理AI与机器人:自动驾驶方面, 比亚迪/吉利/现代/日产等厂家加入Robtaxi, 并与Uber合作。然后机器人方面KUKA/ABB等厂商, 还有很多机器人/无人机平台等。

  总体来说,这次发布会,除了澄清了铜缆和CPO会并用,主要就是新加入了一个服务器中新加入了Groq的LPU选项。这个在Groq被买后,市场已有充分预期;甚至指引的三年一万亿美金收入,市场实际其实也已经超过这个数字了。

  整体上从英伟达的产品迭代可以看到:最近几年的迭代重心不再芯片微架构的创新,从Hopper到Blackwell解决主要是组合和连接的问题,英伟达主要是完成了卖芯片到卖系统和服务的切换。

  而从Blackwell到Rubin,无论是新加入的DPU,还是这次新买来后紧急放进来的LPU,主要完成的是AI进入推理和Agent时代,内存墙的问题。

  二、英伟达的近况:大会指引平淡,需要“成长性新故事”

  英伟达的股价表现,在近半年的时间内基本上一直都在170-200美元的区间内震荡。即便下游大厂增加资本开支、公司业绩持续超预期,公司股价也没能实现向上突破,主要是市场有以下几方面担心:

  a)大厂资本开支持续性:Meta、谷歌等厂商都明确增加了2026年的资本开支,四大核心云厂商在2026年的资本开支有望达到6600亿美元以上,同比增长60%。但值得注意的是,大厂资本开支在收入中的占比处于达到了相对较高的位置。

  以Meta为例,公司预期2026年资本开支将达到1150-1350亿美元,资本开支/年度收入将达到50%以上,进一步提升的空间相对有限。即使各家大厂增加了2026年的投入展望,但依然难以打消市场对后续资本开支增长持续性的担心。

  b)AI芯片市场份额:当前英伟达在AI芯片市场的份额维持在75%以上,较高的价格和“近乎垄断”的市场结构,促使下游云厂商寻求“替代方案”。

  在谷歌之外,博通AVGO已经明确收获了Anthropic、Open AI等的大额订单,多个客户也都开启了自研方案。即便英伟达后续还有Rubin新品,但市场普遍预期公司在AI芯片市场的份额将逐步下滑。

  3)产品竞争力:当前谷歌TPUv7在FP8等领域的表现大致已经接近于英伟达的B200,谷歌TPU大致落后于英伟达一年左右。

  英伟达在Blackwell系列中引入了NVFP4 格式,能使推理性能在FP8的基础上再翻一倍。但其实FP8满足了当前市场大部分的需求,TPUv7已经是一个“替代选项”。

  为了对抗行业竞争,英伟达正在通过战略投资和算力扩容,来锁[*]供应链上下游,比如说,以芯片部署为前提的战略投资Open AI和Anthropic、为Meta旗下全新 AI 实验室MSL提供数百万块GPU的算力支持,其中部分协议有一定的降价锁定客户需求的意味。

  结合上述的市场担心,公司估值也处于相对较低的位置。海豚君按照截止25-27自然年数据中心收入1.15万亿,英伟达当前市值,对应2028财年净利润约为13倍PE左右。

  英伟达上季度交出了超预期的财报,但公司股价并未迎来上涨。这主要是因为2027年收入预期已经全部打进去后,市场担心下游云厂商在资本开支强度拉到50%以上的之后,进一步拉高资本开支的空间非常有限。

  理论上,处于云厂商二级导上的英伟达,即使客户资本开支高位维持,英伟达来自云客户的收入会就变成零增长,市场不敢给2027年之后的英伟达高估值,导致英伟达当前只有27年利润13X的PE,建筹的兴趣也不高。

  结合本次GTC大会的内容来看,老黄给出的“至2027年数据中心累计收入达到1万亿美元以上”,其实市场预期早已拉到比这个数还更高一些。

  会议中更多的时间,给到了英伟达的产品推销和路线规划,对产业链公司的影响更多,对公司自身的增量信息并不多。

  未来英伟达公司的PE再次提升,海豚君认为除了AI应用上能够更大规模、更快速度落地之后,还需要新的“成长曲线”来拉动,比如“Physic AI”、“太空算力”等。

温馨提示:所有理财类资讯内容仅供参考,不作为投资依据。