现在一块顶级AI芯片,在很多实际部署场景里,利用率只有30%到50%。大量时间都在等内存把数据送过来。这就是常说的内存墙。 算力可以一直堆,但内存的带宽、容量、散热跟不上,再贵的GPU也是闲着,AI基建的真实成本比账面高得多。 这一年开始出现一个我关注的变化:内存解耦。过去主流方案都是把HBM通过2.5D先进封装紧贴GPU放在一起,因为传统电互连距离一拉长,带宽、延迟和功耗都会迅速恶化。 而现在,越来越多厂商开始尝试用光互连代替部分传统电互连,把内存从GPU附近扩展到更远的位置,同时依然保持高速数据传输。 如果这条路线成熟,同样数量的GPU就有机会完成更多计算任务,在部分场景下,有效算力甚至有望接近翻倍,而不需要增加更多GPU。 真正值得关注的是,这意味着未来产业价值,可能不再只集中在HBM本身和先进封装,而会逐渐向GPU与内存之间高速互连这一层迁移。 沿着这条产业链,我整理了9家公司,分成4层: 一、内存层 1️⃣ 美光 MU|HBM内存龙头之一 HBM4今年一季度已量产、产能卖断到2026 光互连层(数据改用光、不用铜,这是价值迁移的那一侧) 二、光互连层 2️⃣ Credo |AI连接芯片+铜缆 OmniConnect方案直接冲着内存墙做 3️⃣ Lumentum|光学与激光器件 3月底英伟达注资约20亿美元 4️⃣ Coherent|光收发器+激光器 同期英伟达也注资约20亿 三、定制芯片层 5️⃣ Marvell |定制ASIC+光DSP+互连 与博通合占ASIC协同设计约95% 6️⃣ 博通|定制AI芯片+交换芯片 AI积压订单超730亿美元 四、整机与加速器层 7️⃣ 英伟达|卖的是AI整机 Blackwell和Rubin都已量产 8️⃣ AMD |第二大加速器 新平台MI400塞了432GB的HBM4 五、制造层 9️⃣ 台积电 |所有芯片的代工厂 CoWoS先进封装是绕不开的卡口 ❤️一点想法: AI第一阶段,比的是谁能买到更多GPU。 第二阶段,比的是谁能拿到更多电力、散热和网络资源 第三阶段比的则是别让GPU闲着。 内存墙,就是第三阶段最值得关注的方向之一 把这条链当一个整体看,光互连那一侧,英伟达最近给Lumentum和Coherent各注资,还签了激光器长约,真金白银投了票,这个信号比任何分析都直接。 #美股