当前位置:主页 > 快讯 > 正文

黄仁勋亲自“定义”英伟达:将“电子”转为“Token”的转换器

发布时间:2026-04-16 已有: 位 网友关注

  你们在OpenAI投入了高达300亿美元,在Anthropic投入了100亿美元。但如今它们的估值已经大幅攀升,而且相信还会继续上涨。

  你们还在为CoreWeave提供高达63亿美元的背书,并已投资20亿美元。

  英伟达为什么不自己做云服务?为什么不自己成为超大规模云服务商,直接出租这些算力?你们有足够的现金。

  这是公司的经营哲学,我认为它是正确的:做一切必要的事,尽可能少做。这意味着,我们在构建计算平台这件事上所付出的努力,如果不是我们来做,我真诚地相信,没有人会去做。如果我们不承担我们承担的风险——如果我们没有以那样的方式构建NVLink,没有构建整个技术栈,没有打造那个生态系统,没有在二十年里持续耕耘CUDA并在大部分时间里处于亏损——如果我们当初没有这样做,没有人会这样做。

  如果我们没有创建所有CUDA-X领域专用库——十五年前我们就开始推进领域专用库的建设,因为我们意识到如果不这样做,无论是光线追踪、图像生成,还是早期的AI模型,还是数据处理、结构化数据处理、向量数据处理,这些库如果不是我们来做,没有人会做。我对此深信不疑。我们为计算光刻创建了cuLitho这个库,如果不是我们,也不会有人做。所以,如果我们没有做这些工作,加速计算就不会取得今天的进展。

  这些事,我们应该做。我们应该全力以赴,倾公司之力去做。但是,世界上有很多云服务。即使我们不做,也会有人站出来做。所以,遵循做必要的事、尽可能少做这一哲学,我用这个视角审视我做的每一件事。

  具体到云服务商,如果不是我们支持CoreWeave的存在,这些新型AI云就不会存在。如果不是我们帮助CoreWeave起步,它们就不会有今天。如果不是我们支持Nscale,它们不会走到今天。如果不是我们支持Nebius,它们也不会有今天的成就。现在它们都做得非常出色。

  这是一个我们应该投入的商业模式吗?我们做必要的事,尽可能少做。我们投资生态系统,是因为我希望生态系统繁荣,希望这个架构和AI能够连接尽可能多的行业和国家,让整个星球都能建立在AI之上,建立在美国技术栈之上。这正是我们追求的愿景。

  我提到的另一件事是,有这么多出色的基础模型公司,我们尽力投资所有的公司。这是我们做事的另一个方式:不挑赢家。我们需要支持所有人。这既是我们乐于做的,也是我们业务上的迫切需要。但我们也刻意不去挑赢家。所以每当我投资其中一家,我也会投资其他所有家。

  第一,这不是我们的职责。第二,英伟达刚成立时,市场上有60家3D图形公司,我们是唯一一家存活下来的。如果当时有人要从这60家里预测谁能最终胜出,英伟达大概会排在最不可能的那一梯队。

  这是在你出生之前的事了,但英伟达当年的图形架构方向是恰好走错了——不是稍微偏了点,而是完全走错了方向。我们从扎实的第一性原理出发来推演,但最终走到了一个错误的答案,开发出了一个开发者几乎无法支持的架构,看起来毫无未来可言。当时每个人都会把我们排除在外。但你看,我们在这里。

  这份经历让我有足够的谦逊去认识到:不要挑赢家。要么放手让他们各自证明自己,要么把所有人都扶持起来。

  有一件事我没明白。你说,我们支持这些新型云服务商,并不只是为了扶持他们而扶持他们。但紧接着你又列举了一批新型云服务商,说如果没有英伟达,它们就不会存在。这两句话怎么能并立?

  首先,他们自己要有存在的意愿,要主动来寻求我们的帮助。当他们有意愿存在、有商业计划、有专业能力和热情,也具备必要的实力,但在起步阶段需要一些投资才能落地时,我们会在那里。但我们的目标是,他们的飞轮越快自转越好。

  你的问题是,我们是否想做融资业务?答案是不。有专门做融资的机构,我们宁愿与所有这些机构合作,而不是自己成为一个融资方。我们的目标是专注于我们所做的事,保持商业模式的简洁,支持我们的生态系统。

  当OpenAI这样的公司在IPO之前需要三百亿美元规模的融资,而我们深信他们,深信他们已经是一家非凡的公司、将来也必然是一家卓越的公司,世界需要他们存在,我也需要他们存在,他们有强劲的发展势头,那就让我们支持他们,帮助他们扩大规模。这样的投资我们会做,因为他们需要我们。但我们并不是努力做尽可能多的事——我们是做尽可能少的事。

  这也许是个显而易见的问题,但我们已经在这种GPU短缺的状态下生活了好多年,随着模型不断进步,这种短缺还在加剧。

  是的。英伟达以非单纯竞价方式来分配稀缺的配额,而是会说:我们希望确保这些新型云服务商存活下去,给CoreWeave一些,给Crusoe一些,给Lambda一些。这对英伟达有什么好处?首先,你是否认同我这个分散市场的描述?

  不。不,你的前提是错的。我们对这些事情相当用心。首先,如果你不下采购订单,说再多也没用。在我们收到采购订单之前,我们能做什么?所以,第一件事是我们与各方努力完成预测,因为这些东西需要很长时间来制造,数据中心的建设也需要很长时间。我们通过预测来对齐供需关系,这是第一要务。

  第二,我们努力与尽可能多的合作伙伴完成预测,但归根结底,你还是必须下订单。也许因为某种原因,你没有及时下单,我能怎么办?到了某个节点,就要先来先得。但除此之外,如果你因为数据中心没有准备好,或者某些组件还没到位,暂时无法搭建数据中心,我们可能会决定先服务另一个客户,这是为了最大化我们自己工厂的产出,我们可能会做一些这样的调整。

  除此之外,排序原则就是先来先得,你必须下采购订单。当然,网上有各种传言,比如那篇关于Larry Ellison和埃隆·马斯克与我共进晚餐、向我乞讨GPU的。这从来都没有发生过。我们确实一起吃了晚饭,那是一顿很愉快的晚餐,但他们从始至终没有乞讨过GPU,他们只是下了订单而已。一旦他们下了订单,我们就会尽力满足产能。我们没有那么复杂。

  好的。听起来,流程上有一个队列,根据你的数据中心是否准备就绪,以及你何时下了采购订单,来决定供货时间。但这听起来并不是价高者得。有什么原因不这样做吗?

  因为这是不好的商业行为。你定好价格,客户决定买不买。我知道芯片行业有人在需求旺盛时涨价,但我们从来不这样做,这从来就不是我们的做法。你可以信赖我们。我更希望成为行业的基石,一个可以依赖的存在。你不需要猜测。我给你报了一个价,就是这个价,就算需求冲到天上也好,随它去。

  是的,英伟达与台积电的合作已经差不多三十年了。英伟达和台积电之间并没有正式的法律合同,有时我占了便宜,有时我吃了亏,但总体而言,这段关系非常出色,我可以完全信任他们,完全依赖他们。

  英伟达有一件事你可以确定:今年,Vera Rubin会非常出色;明年,Vera Rubin Ultra会来临;后年,Feynman会到来;再下一年,我还没公布名字。你可以每年都指望我们。全球你去找另一个ASIC团队,任何一个,你能说我可以把我的全部身家都押在你身上,相信你每年都会出现,每年的Token成本都会下降一个数量级,我可以像信赖时钟一样信赖你——我刚才说的是台积电,历史上没有哪家晶圆厂能让你这么说,但今天你可以这样说英伟达。

  如果你想购买价值10亿美元的AI算力工厂,没问题;1亿美元,没问题;1000万美元或一个机架,没问题;一张显卡,也没问题;想下一笔1000亿美元的AI算力工厂订单,没问题。今天全球只有我们一家公司可以这么说。

  我对台积电也一样:买一台,买十亿台,没问题,只需要走正常的计划流程。英伟达作为全球AI产业基石的地位,是用数十年的巨大承诺和奉献换来的。我们公司的稳定性和一致性,是极其重要的。

  首先,Mythos是在相当普通的算力规模上训练出来的,由一家非凡的公司完成。它所使用的算力规模和类型,在中国是完全可以获得的。所以,

  他们生产全球约60%的主流芯片,甚至可能更多,这对他们来说是个庞大的产业。他们拥有全球顶尖的计算机科学家,众所周知,这些AI实验室里的AI研究人员有相当大比例是中国人。

  他们拥有全球约50%的AI研究人员。所以问题是:考虑到他们已经拥有的这些资产——充裕的能源、大量的芯片、大多数AI研究人员——如果你担忧他们,创造一个安全世界的最佳方式是什么?

  当然我们希望美国拥有尽可能多的计算资源。我们受到能源的限制,但我们有很多人在努力解决这个问题。我们不能让能源成为我们国家的瓶颈。但我们还希望确保世界上所有的AI开发者都在美国技术栈上进行开发,并将AI的进步——尤其是开源的——提供给美国生态系统。创建两个生态系统将是极其愚蠢的:一个开源生态系统,它只能在一个外国技术栈上运行;以及一个封闭的生态系统,它在美国技术栈上运行。我认为这对美国来说将是一个可怕的结局。

  认为英伟达是一家美国公司吗?好的。第一,为什么我们不制定一个更平衡的法规,让英伟达可以在全球获胜,而不是放弃世界?你为什么要让美国放弃世界?

  芯片行业是美国生态系统的一部分。它是美国技术领先地位的一部分。它是AI生态系统的一部分。它是AI领先地位的一部分。为什么你的政策、你的哲学会导致美国放弃世界市场的巨大一部分?

  首先,解决这个问题的方法是与研究人员对话,与中国对话,与所有国家对话,确保人们不会那样使用技术。这是必须进行的对话。好的。第一点。

  第二点,我们还需要确保美国领先,确保Vera Rubin、Blackwell在美国丰富、大量地可用。显然,我们的结果会显示这一点。丰富,大量的。我们拥有的计算资源很棒。我们这里有很棒的AI研究人员。很棒。我们应该保持领先。

  然而,我们也必须认识到,AI不仅仅是一个模型。AI是一个五层蛋糕。AI产业在每一层都很重要,包括芯片层。

  所以,如果我们处在一个你已经是N3节点主要客户的世界里——在某个时候你会用到N2,并且你会是N2的主要客户——你是否认为你可以回到N7节点,一个更旧工艺节点的闲置产能,然后说,“嘿,对AI的需求如此巨大,而我们扩展前沿节点的能力无法满足它,所以我们将制造一个Hopper或Ampere,但使用我们今天所知道的关于数值运算的所有知识以及你描述的所有其他改进”?你认为在2030年之前这种情况会发生吗?

  没有必要。原因在于,每一代架构不仅仅是晶体管尺寸的问题。你在做大量的工程、封装和堆叠工作,以及数值运算和系统架构。

  当你产能耗尽时,轻松回到另一个节点……那是一种没人能负担得起的研发水平。我们能够承担向前推进的成本。我认为我们承担不起回头。现在,如果世界只是说……如果在那一刻,让我们做个思想实验,在那一刻我们被告知,“听着,我们再也不会有更多的产能了。”我会回去用7纳米吗?毫不犹豫地,我当然会。

  我交谈过的人有一个问题,为什么英伟达不同时运行多个完全不同架构的芯片项目?你可以做一个Cerebras风格的晶圆级芯片。你可以做一个Dojo风格的大封装。你可以做一个没有CUDA的。你有资源和工程人才可以并行做所有这些。那么,鉴于谁知道AI和架构可能会走向何方,为什么要把所有鸡蛋放在一个篮子里呢?

  哦,我们可以。只是我们没有更好的主意。我们可以做所有那些事情。只是它们不是更好的。我们在模拟器中模拟了所有,证明它们更差。所以我们不会去做。我们正在做的正是我们想要做的项目。如果工作负载发生巨大变化——我指的不是算法,我实际上指的是工作负载,这取决于市场的形态——我们可能会决定增加其他加速器。

  例如,最近我们增加了Groq,我们计划将Groq整合到我们的CUDA生态系统中。我们现在正在这样做,因为Token的价值已经变得如此之高,以至于你可以有不同的Token定价。在过去,仅仅几年前,Token要么免费,要么几乎不贵。但现在你可以有不同的客户,这些客户想要不同的答案。因为客户赚了很多钱——例如,我们的软件工程师——如果我能给他们响应更快的Token,让他们比今天更高效,我愿意为此付费。

  但那个市场最近才出现。所以我认为我们现在有能力根据响应时间,为同一个模型提供不同的细分市场。这就是为什么我们决定扩展帕累托前沿,创建一个响应时间更快的推理细分市场,即使它的吞吐量较低。直到现在,更高的吞吐量总是更好。我们认为可能存在一个世界,其中可能有非常高ASP的Token,即使工厂的吞吐量较低,ASP也能弥补这一点。

  加速计算,和我们一直在做的一样。我们公司的前提是摩尔定律将……通用计算对很多事情有好处,但对很多计算来说并不理想。

  所以我们结合了一种称为GPU、CUDA的架构和一个CPU,这样我们就可以加速CPU的工作负载。不同的内核代码或算法可以被卸载到我们的GPU上。因此,你可以将应用程序加速100倍、200倍。你可以在哪里使用它?显然是工程、科学、物理、数据处理、计算机图形、图像生成,各种各样的东西。即使今天没有AI,英伟达也会非常非常大。

  原因相当根本,那就是通用计算继续扩展的能力基本上已经走到了尽头。而唯一的方法……不是唯一的方法,但实现这一目标的方法是通过特定领域的加速。我们开始的领域之一是计算机图形,但还有许多其他领域。有各种各样的。粒子物理和流体、结构化数据处理,所有不同类型受益于CUDA的算法。

  我们的使命确实是向世界提供加速计算,并推进通用计算无法完成的应用类型,并将其能力扩展到有助于突破某些科学领域的水平。一些早期的应用是分子动力学、用于能源发现的地震处理、当然还有图像处理,所有这些通用计算效率低下的领域。

  如果没有AI,我会非常难过。但是,由于我们在计算方面取得的进步,我们使深度学习民 主化了。我们使任何地方、任何研究人员、任何科学家、任何学生都能够使用PC或GeForce扩展卡进行出色的科学研究成为可能。这个根本承诺没有改变,一点也没有。

  如果你看GTC大会,有整个开头部分。那里面没有AI。那一整部分关于计算光刻、量子化学工作、数据处理工作,所有这些东西都与AI无关。它仍然非常重要。我知道AI非常有趣且令人兴奋,但有很多人正在做很多非常重要的非AI相关工作,而张量并不是你计算的唯一方式。我们想帮助所有人。

温馨提示:所有理财类资讯内容仅供参考,不作为投资依据。