
Nvidia在传闻Meta正与Google就数十亿美元的定制张量处理单元(TPU)进行深入讨论后,打破沉默。若成真,这将是该公司AI基础设施战略的罕见转向。上周,由于Alphabet股价上涨,Nvidia股价下跌正规配资炒股网,该公司在周二发布了有针对性的声明。
“我们对Google的成功感到高兴——他们在AI领域取得了巨大进展,我们仍在向Google供货,”Nvidia写道。“NVIDIA在行业中领先一代——它是唯一能够在所有计算环境中运行所有AI模型的平台。NVIDIA提供的性能、通用性和可替代性优于专用ASIC,后者仅针对特定AI框架或功能设计。”
此回应凸显了Nvidia对局势的重视。虽然据报Meta的计划包括先租后买,并在2027年开始分阶段采购,但任何对Nvidia硬件的重大转向都将波及整个AI生态系统。Google的TPU架构曾仅供内部使用,如今正成为抢夺Nvidia主导平台的超大规模云服务商业务的积极手段。
OpenAI可能在研发自研芯片,但仍然离不开Nvidia
AI加速器军备竞赛内幕AMD、Nvidia与超大规模云服务商承诺十年内每年发布新产品
亚马逊和Google在宣布自研AI芯片前先告知黄仁勋
We’re delighted by Google’s success — they’ve made great advances in AI and we continue to supply to Google.NVIDIA is a generation ahead of the industry — it’s the only platform that runs every AI model and does it everywhere computing is done.NVIDIA offers greater…November 25, 2025
We’re delighted by Google’s success — they’ve made great advances in AI and we continue to supply to Google.NVIDIA is a generation ahead of the industry — it’s the only platform that runs every AI model and does it everywhere computing is done.NVIDIA offers greater…November 25, 2025
ASIC加速vs GPU通用性Google的TPU是面向特定应用的芯片,针对大型语言模型训练和推理所需的高吞吐矩阵运算进行调优。当前代的TPU v5p配备95 GB HBM3内存,bfloat16峰值吞吐量超过每芯片450 TFLOPS。TPU v5p pod可容纳近9,000颗芯片,并设计为在Google Cloud基础设施内部高效扩展。
关键在于,Google拥有TPU的架构、指令集和软件栈。Broadcom是Google的硅实现合作伙伴,将Google的架构转化为可制造的ASIC布局,同时提供高速SerDes、功率管理、封装,并负责后段测试。芯片制造则由台积电自行完成。
相比之下,Nvidia基于Hopper的H100 GPU拥有800亿晶体管、80 GB HBM3内存,使用FP8精度时可提供高达4 PFLOPS的AI算力。其继任者Blackwell架构的GB200将HBM容量提升至192 GB,峰值吞吐约为20 PFLOPS。该卡还专为与Grace CPU在混合配置中无缝协作而设计,进一步扩大了Nvidia在云端和新兴本地计算节点中的布局。
TPU通过Google的XLA编译器栈进行编程,XLA是JAX和TensorFlow等框架的后端。虽然基于XLA的方式在CPU、GPU和TPU目标之间提供了性能可移植性,但通常要求模型开发者采用针对Google运行时环境的特定库和编译模式。
相对而言,Nvidia的技术栈更为广泛且深度植入行业工作流。CUDA、cuDNN、TensorRT及相关开发者工具构成了大规模AI开发和部署的默认基石,涵盖模型优化、分布式训练、混合精度调度和低时延推理,并得到成熟的框架、预训练模型和商业支持生态的支撑。
因此,从CUDA迁移到XLA并非轻而易举。开发者必须重写或调优代码,管理不同的性能瓶颈,甚至在某些情况下采用全新的框架。Meta内部拥有JAX研发能力,实验条件相对成熟,但摩擦仍是更广泛采用TPU的门槛。
双源供应的韧性据路透社报道,一些Google Cloud高管认为,Meta的这笔交易可能产生相当于Nvidia当前年度数据中心业务约10%的收入。当然,这一数字带有投机成分,但Google已承诺向Anthropic交付多达一百万颗TPU,并在AI创业公司中积极推广其XLA和JAX栈,以提供CUDA的替代方案。
尽管如此,Google的芯片定位单一。TPU专注于一种任务并且做得很好,但也有局限。它们不适用于高性能计算(HPC)仿真、通用科学计算或任何需要灵活执行模型或广泛内核支持的工作负载。TPU只能在Google Cloud上运行,而Nvidia芯片则可在各种云平台、本地系统、工作站乃至边缘设备上使用。
这种灵活性是Nvidia竞争力的核心。Meta等超大规模云服务商并不陌生于定制硅;AWS推出了Trainium,Microsoft有Maia,Google的TPU研发也已近十年。新鲜事在于,另一家超大规模云服务商可能会把部分训练工作从Nvidia平台迁移出去。即使只是部分迁移,也凸显了对双源供应的需求和议价能力。
Grace‑Blackwell加强Nvidia的防线Nvidia的Grace‑Blackwell架构将使此类迁移更加困难。通过高速互连将Blackwell GPU与Grace CPU紧耦合,Nvidia实现统一内存访问,简化了训练和推理工作流。开发者可以在云端GPU集群上训练模型,再在边缘或企业环境中部署而无需更改代码或重新训练。
与此同时,Nvidia正深入那些TPU难以竞争的垂直领域。它在汽车、机器人、制造和零售等行业已建立合作伙伴关系。从Jetson边缘模块到DGX超级计算机,Nvidia正把其技术堆栈定位为AI推理的默认执行环境,而不仅仅是大模型的训练平台。
通过现在探索替代方案,Meta有望在未来的硬件谈判中获得杠杆,并规避供应商锁定的风险。即便Google的TPU不会全面取代H100——实际上也不大可能——它们仍可能承担部分推理任务或在高峰周期提供溢出算力,尤其当经济性更有优势时。
从目前来看,Meta的TPU采用更像是轻度多元化。Nvidia仍主导行业内最大、最显眼的AI工作负载。其软件工具、开发者黏性以及通用计算能力的组合,使其保持的领先优势短时间内难以被TPU抹平。
Google在这场竞争中最大的挑战在于从Nvidia手中夺取市场份额。Meta的参与会为TPU在Google Cloud和Anthropic之外赢得信誉,但规模只是因素之一。TPU能否满足复杂、不断演进的AI工作流需求,尤其是在严格受控环境之外正规配资炒股网,并且是否有更多超大规模云服务商愿意信任一个主要存在于单一公司“围墙花园”中的平台,仍有待观察。
深金优配提示:文章来自网络,不代表本站观点。