然而,目前国内 AI 正在面对算力芯片上的困局:一方面海外高端芯片供应受限,另一方面国内目前单卡算力较北美有一定差距、且单位算力性价比或较低。我们认为,超节点可能是国产算力的破局之道。面对国内“单卡算力有差距”、“单位算力成本更高”两大困局, 我国选取 “超节点”这一路径,超节点通过多卡协同, 依托我国领先的通信技术及工程实现能力,有望在集群层面实现持平甚至赶超海外超节点的性能,同时亦能通过机柜级/系统级架构提高每单位算力的资本效率。例如,根据 SemiAnalysis,华为 910C 的 CM384 超节点便以 5.3 倍于英伟达 GB200 NVL72 的卡数,实现了 1.7 倍于 NVL72 的算力性能;曙光的 ScaleX640 通过 640 张 GPU 堆叠,亦能实现超 600 PFLOPS 算力,比肩国际先进集群水平。我们认为,自 2H25 开始,海外 GPU 对华供应始终存在不确定性(如 H200),而国产 GPU 正在性能、良率、量产能力上逐步突破,在国产卡算力性能仍弱于海外先进卡的背景下,为实现高性能的训练与推理,国产超节点的需求有望持续涌现,从 25 年下半年开始我们已看到来自 CSP 厂商、算力芯片厂商、ICT 厂商等不同主体推出的超节点样品,因此