发布时间:2026-02-03 已有: 位 网友关注
称这种说法“纯属无稽之谈”,并表示英伟达仍计划对OpenAI进行巨额投资。英伟达在一份
知情人士称,OpenAI对英伟达硬件在某些特定问题上的响应速度并不满意,例如软件开发以及AI与其他软件之间的交互。OpenAI需要新的硬件,未来最终可满足其约10%的推理计算需求。
报道称,OpenAI曾讨论与包括Cerebras和Groq在内的初创公司合作,以获得更快推理速度的芯片。不过,英伟达与Groq达成了一项价值200亿美元的授权协议,从而终止了OpenAI与Groq的谈判。
芯片行业高管表示,英伟达迅速拿下Groq,看起来是为了在快速变化的AI行业中巩固其技术组合、提升竞争力。英伟达在
英伟达的GPU非常适合用于训练像ChatGPT这样的大型AI模型所需的海量数据处理,这也是迄今为止全球AI爆炸式增长的重要基础。但随着AI的不断进步,重点正日益转向对已训练模型进行推理和推断,这可能成为AI的一个新阶段。
自去年以来,OpenAI在寻找GPU替代方案时,重点关注那些在同一块硅片上集成大量内存的芯片制造商。尽可能在每颗芯片上塞入昂贵的SRAM,可在聊天机器人和其他AI系统处理数百万用户请求时带来速度优势。
与训练相比,推理对内存的需求更高,因为芯片需要花费相对更多时间从内存中获取数据,而不是进行数学运算。英伟达和AMD的GPU技术依赖外部内存,这会增加处理时间,降低用户与聊天机器人交互的速度。
有知情人士称,在OpenAI内部,这一问题在其用于生成计算机代码、并正被公司大力推广的产品Codex中尤为明显。OpenAI员工将Codex的部分性能不足归因于基于英伟达GPU的硬件。
上月,OpenAI首席执行官Sam Altman表示,使用OpenAI编程模型的客户“会为编码工作的速度支付很高的溢价”。OpenAI 满足这一需求的方式之一,是其最近与Cerebras达成的合作协议。对于普通的ChatGPT用户而言,速度并非那么关键。
相比之下,Anthropic的Claude和谷歌的Gemini等竞争产品,更多依赖谷歌自研的TPU进行部署。TPU专为推理所需的计算而设计,在性能上可能优于像英伟达GPU这样的通用型AI芯片。
当OpenAI明确表达了对英伟达技术的保留态度后,英伟达曾接洽包括Cerebras和Groq在内、专注于高SRAM芯片的公司,探讨潜在收购的可能性。知情人士称,Cerebras拒绝了收购提议,并与OpenAI达成了一项商业合作,该合作已于上月宣布。
媒体称,Groq也曾与OpenAI就提供算力展开讨论,并吸引投资者兴趣,拟以约140亿美元的估值为公司融资。
但到12月时,英伟达以一项非独家的全现金交易,获得了Groq技术的授权。尽管该协议允许其他公司也可授权使用Groq的技术,但目前Groq正将重心转向销售云端软件,因为英伟达已挖走了Groq的芯片设计人员。