Scale-up 带宽密度大幅提升,Scale-up 较 Scale-out 对光连接的需求呈指数级上升。Scale-up 在单系统中极高密度地集成 GPU 与 HBM,可以使所有 GPU 在同一空间内共享 HBM,规避了跨节点通信的性能瓶颈,极大提升了训推效率。当前 Scale-up 主要采用柜内铜缆互连。然而,随着 AI 集群从单机柜的 64-72 颗GPU,扩展至跨机柜的数百乃至上千颗 GPU,互连链路的长度将延伸至 20 米左右。而传统的铜缆仅能延伸至 7 米,已难以满足高性能互联需求,因此需要引入光互连方案。同时,Scaleup 的带宽需求是 Scaleout 的 10 倍,使光互联呈指数级增长。以英伟达为例,英伟达 Blackwell 平台上的第五代 NVLink 为每个 GPU提供 900GB/s(7,200Gb/s)的单向带宽,比后端横向扩展网络中每个 GPU 的100GB/s(800Gb/s)带宽高出 9 倍。