2016 年,谷歌发布了第一代专为机器学习设计的 ASIC 芯片——TPU(Tensor Processing Unit);2018 年,谷歌在其 TPU v3 版本中首次应用液冷技术;目前,谷歌 TPU 已迭代至第七代(Ironwood),其单芯片在 FP8 精度下算力达4.6 PFLOPS,单芯片功耗达到 980W。每台 TPU v7 服务器部署 4 颗 TPU v7 芯片,整柜采用 16 台 2U 服务器的形态,合计部署 64 颗 TPU v7 芯片, 整柜的热设计功率约为 80-90kW, 大幅超出一般风冷散热的物理上限,因此服务器的 TPU部分采用了独立冷板液冷覆盖,而 CPU、电源、存储部分仍结合风冷散热。