发布时间:2026-04-30 已有: 位 网友关注
币界网消息,英伟达发布了关于其Blackwell系列的成本明细,指出GPU成本比上一代贵一倍,但每token成本却便宜35倍。根据英伟达的博客,评估推理基础设施时应关注「每token成本」而非「每GPU每小时成本」。以deepseek-r1为测试对象,Blackwell与上一代Hopper进行对比。按云市场租赁参考价,Blackwell每GPU每小时2.65美元,较Hopper的1.41美元贵近一倍,但单GPU每秒token产出从90跳到6000,提升65倍,分摊后每百万token成本从4.20美元降至0.12美元。需要注意的是,0.12美元的成本是基于FP4低精度推理和多token预测等多项软件优化开启的前提下得出的。