TCO优势:全栈垂直整合带来30-40%成本降低。从 Google自用的度来看,TPU 集群凭借 OCS 网络和定制编译器,在相同负载下,Ironwood 的全包推理成本 TCO 约比 GB200 服务器的 TCO 低 44%,而峰值 FLOPs 和峰值内存带宽仅有约 10%的差距。从客户 Anthropic 角度来看,在 Google 对外出租 TPU v7 并获利的情况下,Ironwood 的每小时 TCO 仍可比 GB200 低约30%,并比 GB300 低约 41%。TCO 优势是谷歌 TPU 的核心竞争力,使其在AI 推理场景下极具商业价值。