数据中心

AI 数据中心基建与超节点架构的同花顺概念归并页

迁移说明

合并内容

原页面:AI数据中心基建

AI数据中心基建

一句话定义:AI数据中心基建是由科技巨头主导的万亿级资本开支浪潮,涵盖算力集群、电力系统、冷却方案和能源供给,正成为美国GDP增长的核心驱动力。

投资规模与战略逻辑

巨头资本开支
投资逻辑:"投资不够的风险远大于过度投资"

全球数据中心容量格局(伯恩斯坦 2026-04)

总容量与增长
情景 2025 2030E CAGR
基准情景 ~100 GW ~190 GW 18%
高需求情景 ~100 GW ~220 GW 20%

伯恩斯坦:当前全球约有 100 GW 数据中心供应,未来5年市场规模将达到 ~190 GW(基准)或 ~220 GW(高需求)。无论对AI需求持何种观点,当前建设热潮正处于全盛期。

超大规模厂商自有容量
年度新增供应(按所有者,GW)
年份 Google Meta Microsoft Amazon 其他超大规模 私有/电信/其他 DLR+EQIX
2025 3 7 8 9 1 4 5
2028E 7 13 15 16 3 4 8

AWS 在 2025 年新增的数据中心容量超过全球任何其他公司。


容量获取策略分层

伯恩斯坦提出 hyperscaler 容量优先级框架:

优先级 模式 代表玩家 特点
1 自建(Own Capacity) MSFT、AMZN、GOOG、META 完全控制、最佳长期 ROI、最大灵活性; capex 高、建设慢
2 整栋租赁(Lease Full Building) DLR、Switch、Vantage 将开发外包、保留硬件所有权;租约 10-20 年
3 部分租赁/托管(Colo) DLR、EQIX、QTS 针对特定市场需求、灵活性强;容量有限
4 传统云/Neocloud CRWV、NBIS、Lambda 最快上市、最低承诺;粘性最低、最容易流失

核心判断:当前"土地争夺"阶段,四种模式同时发生。但当供需缓解时(预计 2028-2029 年),第四类(Neocloud)将最快、最严重受到冲击——因为退出 Neocloud 关系比搬离数据中心容易得多(合同更短、无需迁移硬件)。


Neocloud 与数据中心租赁

CoreWeave 最新动态
Hyperscaler 为什么仍签 Neocloud?
  1. 现有电力容量和上市速度:CoreWeave 拥有挖矿时代遗留的电力资源,且通过长期租约锁定了增量容量
  2. 短期承诺、能见度有限:相比自建或 15 年租约,5 年 Neocloud 合同承诺更低
  3. 沙盒和学习机会:CoreWeave 是目前最成熟的 GPU 云运营商,hyperscaler 希望先试用再大规模自建
主要 Hyperscale 协议概览(伯恩斯坦整理)
客户 供应商 时间 金额 说明
MSFT CRWV 2023-03 $100 亿 云计算容量
MSFT NBIS 2025-09 $194 亿 计算容量
Meta CRWV 2025-09 $142 亿 云计算容量
Meta CRWV 2026-04 $210 亿 初始合同延期
Meta NBIS 2026-03 $270 亿 AI 基础设施
ORCL Crusoe 2026-03 Stargate 相关(Oracle 取消后由 MSFT 接手)
OpenAI CRWV 2025-03 $119 亿 云计算+股票购买 $3.5 亿
OpenAI Stargate 多伙伴 2025-09 ~$3,000 亿 Oracle/Crusoe/MSFT/AMD/Broadcom 联合

Hyperscaler 电力与容量披露

公司 时间 关键披露
Microsoft 2026-01 单季度新增近 1 GW 总容量;过去12个月新增超 2 GW
Amazon 2026-02 Q4 新增 1 GW+;过去12个月新增 3.9 GW;预计 2027 年底前再翻倍
Oracle 2026-03 已通过合作伙伴锁定未来3年 >10 GW 电力和数据中心容量;>90% 已全额融资
Oracle 2025-12 Q2 交付近 400 MW 数据中心容量;GPU 容量环比 +50%
Meta 2025-09 部署 6 GW AMD Instinct GPU 跨多代产品;首个 GW+ 集群 Prometheus 2026 年上线
Meta 2025-01 2025 年上线近 1 GW;正在建设 2 GW 或更大的 AI 数据中心
Google 2026-02 2026 全年 CapEx $1,750-1,850 亿

电力危机与能源供给

美国电力缺口
发电结构现状
燃气涡轮发电机
变压器短缺
核能展望

数据中心技术趋势

供电架构演进
冷却方案
规模经济

应用结构变化


本次摄取变更

来源伯恩斯坦——CoreWeave: 对数据中心容量的"土地争夺"仍在继续…人人都想要吉瓦(GW)!.pdf(2026-04-14)

Diff 类型 说明 严重程度
新增指标 全球数据中心容量基准:当前 ~100 GW,2030E ~190 GW(基准)/ ~220 GW(高需求) high
新增指标 Hyperscalers 当前自有 ~40 GW,已宣布 2030 前新增 ~30 GW high
新增指标 容量获取策略四层框架(自建→整栋租赁→Colo→Neocloud) normal
新增指标 Meta 与 CoreWeave $210 亿 追加订单、Anthropic 新多年期协议 high
新增指标 Hyperscaler 电力/容量披露汇总表(MSFT/AMZN/ORCL/META/GOOG) normal
预测偏差 数据中心供需缓解时点:伯恩斯坦预测 2028 年(极乐观则 2029) high
关系变化 CoreWeave 合同结构:"take or pay" GPU 容量承诺,Meta 即使自建上线也需付费 normal

信息来源

日期 来源文件 核心内容 信源权重
2026-04-14 伯恩斯坦——CoreWeave: 对数据中心容量的"土地争夺"仍在继续…人人都想要吉瓦(GW)!.pdf 全球 DC 容量预测、土地争夺框架、Neocloud 长期风险、Hyperscaler 电力披露 🟢 high
2025-11-14 AI数据中心的万亿大基建时代 OpenAI/xAI/Meta/微软投资规模、电力危机详细分析、燃气涡轮机/变压器短缺、800V HVDC技术演进、中美电网建设对比、训练vs推理结构变化 🟡 medium
2026-01-04 Semianalysis:AI如何解决电力危机.pdf PDF文件,仅记录引用,未提取详细内容 🟢 high
2026-02-12 CITI-Vertiv Holdings Co.pdf PDF文件,仅记录引用,未提取内容 🟢 high

[2026-04-18] lint | 补充交叉引用,新增 5 个 outgoing link(液冷、HVDC、谷歌英伟达

本页面由 LLM 基于原始剪报自动整理生成,最后更新:2026-04-18


原页面:超节点

超节点(SuperNode)

一句话定义:面向大模型训练与推理设计的新一代整机柜级一体化 AI 算力基础设施,通过芯片级高速互联、统一液冷供电与集中式管理,将多机柜上万颗芯片组成的集群在使用上如同一台巨型超级计算机。


核心定义

超节点将数十到数百颗 GPU/NPU 在物理与逻辑层面深度紧耦合:


解决的问题

传统服务器集群在大模型训练中遇到三大瓶颈:

  1. 通信墙:传统以太网与 PCIe 组网时延高、带宽不足,万卡集群算力利用率大幅下降
  2. 功耗墙:高密度 AI 芯片功耗飙升,风冷无法满足散热需求
  3. 复杂度墙:松散堆叠的服务器部署复杂、故障点多、调度效率低

海外方案

产品 厂商 规格 特点
GB200 NVL72 英伟达 单机 72 卡 NVLink 高速互联,全球标杆
GB300 系列 英伟达 迭代升级 持续提升算力密度与集群扩展

国产方案(2024-2026)

产品 厂商 规格 互联协议
ETH-X 腾讯 单机柜 64 颗 GPU 以太网 RoCE
Atlas A3 900 SuperPoD 华为 最大 384 颗昇腾 910 NPU 自研 LQC 协议
磐久 AL128 阿里 128-144 卡 自研 ALink 协议
ScaleX640 中科曙光 640 卡规模 自研 ScaleFabric
大禹超节点 字节跳动 64-128 卡 自研 EthLink
ScaleX40 中科曙光 40 卡无线缆架构
Atlas A3 950 SuperPod 华为 8192 颗昇腾 950 NPU

Scale Up 主流协议

国际:封闭 vs 开放双轨
协议 主导方 特点
NVLink 英伟达 封闭生态,单 Pod 576 GPU,极致性能
UALink AMD 开源,单 Pod 1024 GPU,多厂商兼容
SUE 博通 基于以太网,兼容现有基础设施
国内:三条技术路线
  1. 自主可控专用总线:华为灵衢(UnifiedBus)、海光 HSL
  2. 以太网优化:字节 EthLink、腾讯 Eth-X
  3. 开放基础设施:中国移动 OISA 协议

国产交换芯片玩家

独立交换芯片厂商
公司 产品 特点
盛科通信 12.8T/25.6T 交换芯片 国内领先,已导入主流设备商
数渡科技 PCIe 5.0 交换芯片 国内极少数掌握自主设计能力
澜起科技 PCIe 6.x/CXL 3.x Retimer 高速互连领域不断拓展
大厂自研
公司 产品 特点
华为 CloudEngine XH9230(51.2T) 自研 Solar 系列交换芯片
海光信息 HSL 协议开放生态 CPU+DCU+Switch 互联全覆盖
中兴通讯 自研 AI 交换芯片 超节点方案已推出
新华三 智擎系列 NP 芯片 1.2Tbps 接口吞吐

国产超节点三次跃迁(2025-2026)

时间 产品 厂商 规格 意义
2025年初 昇腾384 华为 12机柜,384卡 打破AI算力互联瓶颈,国产超节点元年
2025年中 磐久AL128 阿里 单柜128卡 算力集成度达昇腾384的4倍
2025年底 scaleX640 中科曙光 单柜640卡 世界首个单机柜级640卡,算力集成度达384的20倍

scaleX640关键指标


国产技术路线分化

路线 代表厂商 特点
封闭全栈 华为昇腾 纵向一体化,系统一致性高,生态兼容受限
开放架构 曙光、浪潮、阿里 多芯片共存,算力生态多元化

英伟达化进展


昇腾超节点架构特点

配置项 规格
机柜总数 16个(4互联总线柜+12服务器柜)
机柜高度 47U非标准,2.2米(高于标准42U)
芯片数量 384颗NPU(满配)
服务器配置 单个计算柜4台10U高950服务器
互联交换机 400G高速交换机
定价 满配1.3-1.5亿元/套

出货情况:截至2026春节前交付550套,覆盖30+行业,总销售额700亿+人民币。


投资建议(东吴电子)

重点推荐:盛科通信、海光信息 建议关注:中兴通讯、澜起科技、万通发展(数渡科技)


信息来源

日期 来源文件 核心内容 信源权重
2026-04-07 【东吴电子陈海进】超节点系列报告一:国产超节点方案量产元年,看好以太网成为主流技术路径.md 国产超节点方案、协议路线、芯片玩家 🟡 medium
2026-03-27 国产算力的开放时刻:超节点迈入万卡纪元.md 国产万卡超节点、开放架构、去英伟达化 🟡 medium
2026-01-06 国产超节点推陈出新,性能+生态壁垒双双攻克!.md 国产超节点三次跃迁、scaleX640指标 🟡 medium
2026-03-27 昇腾芯片950.md 昇腾超节点硬件配置、定价与出货 🟡 medium

[2026-04-18] lint | 补充交叉引用,新增 5 个 outgoing link(英伟达昇腾芯片液冷DeepSeek

本页面由 LLM 基于原始剪报自动整理生成,最后更新:2026-04-18