数据中心
数据中心
AI 数据中心基建与超节点架构的同花顺概念归并页
迁移说明
- 同花顺概念:数据中心(308642)
- 合并来源:
AI数据中心基建.md、超节点.md - 迁移日期:2026-04-19
合并内容
原页面:AI数据中心基建
AI数据中心基建
一句话定义:AI数据中心基建是由科技巨头主导的万亿级资本开支浪潮,涵盖算力集群、电力系统、冷却方案和能源供给,正成为美国GDP增长的核心驱动力。
投资规模与战略逻辑
巨头资本开支
- OpenAI Stargate:计划投入约1.4万亿美元,建设超30吉瓦计算基础设施,目标每周新增1吉瓦
- xAI(马斯克):计划5年内上线AI算力达到等价于5,000万台H100的量级
- 四大CSP(2025上半年):亚马逊、Alphabet、微软、Meta合计资本支出约1,715亿美元,全年上修至3,500亿美元以上
- 未来五年全球数据中心基建投资:预计达5-7万亿美元(黄仁勋及咨询公司观点)
- 2025年上半年美国GDP增长:几乎完全由数据中心和信息技术推动,其他领域增长率仅0.1%
投资逻辑:"投资不够的风险远大于过度投资"
- Power First策略:最缺的是电,谁能拿到电就能带起更多GPU,训练更好模型,占据更大市场份额
- Underinvestment is riskier than overinvestment:在AI军备竞赛中,投资不够可能导致公司失去竞争力甚至生死存亡;过度投资的风险有封顶(固定资产可转卖或出租)
- Bill will always eat Andy:有基础设施和硬件,软件总有办法把资源运用掉
全球数据中心容量格局(伯恩斯坦 2026-04)
总容量与增长
| 情景 | 2025 | 2030E | CAGR |
|---|---|---|---|
| 基准情景 | ~100 GW | ~190 GW | 18% |
| 高需求情景 | ~100 GW | ~220 GW | 20% |
伯恩斯坦:当前全球约有 100 GW 数据中心供应,未来5年市场规模将达到 ~190 GW(基准)或 ~220 GW(高需求)。无论对AI需求持何种观点,当前建设热潮正处于全盛期。
超大规模厂商自有容量
- 当前 hyperscalers(AMZN、GOOG、META、MSFT、ORCL)全球自有容量约 ~40 GW
- 已宣布的自有增量容量约 ~30 GW(2030年前上线)
- 随着土地银行扩大和资本开支持续上升,这一数字可能继续加速
年度新增供应(按所有者,GW)
| 年份 | Meta | Microsoft | Amazon | 其他超大规模 | 私有/电信/其他 | DLR+EQIX | |
|---|---|---|---|---|---|---|---|
| 2025 | 3 | 7 | 8 | 9 | 1 | 4 | 5 |
| 2028E | 7 | 13 | 15 | 16 | 3 | 4 | 8 |
AWS 在 2025 年新增的数据中心容量超过全球任何其他公司。
容量获取策略分层
伯恩斯坦提出 hyperscaler 容量优先级框架:
| 优先级 | 模式 | 代表玩家 | 特点 |
|---|---|---|---|
| 1 | 自建(Own Capacity) | MSFT、AMZN、GOOG、META | 完全控制、最佳长期 ROI、最大灵活性; capex 高、建设慢 |
| 2 | 整栋租赁(Lease Full Building) | DLR、Switch、Vantage | 将开发外包、保留硬件所有权;租约 10-20 年 |
| 3 | 部分租赁/托管(Colo) | DLR、EQIX、QTS | 针对特定市场需求、灵活性强;容量有限 |
| 4 | 传统云/Neocloud | CRWV、NBIS、Lambda | 最快上市、最低承诺;粘性最低、最容易流失 |
核心判断:当前"土地争夺"阶段,四种模式同时发生。但当供需缓解时(预计 2028-2029 年),第四类(Neocloud)将最快、最严重受到冲击——因为退出 Neocloud 关系比搬离数据中心容易得多(合同更短、无需迁移硬件)。
Neocloud 与数据中心租赁
CoreWeave 最新动态
- Meta 追加 $210 亿订单(2026-04):为 CoreWeave 史上最大单笔 deal,是此前 $142 亿合同的延期扩展
- Anthropic 签署多年期协议(2026-04):金额未披露,但确认是新客户 logo
- CoreWeave 仍被伯恩斯坦评为 Underperform(目标价 $67),核心担忧:当数据中心供应充足后,hyperscaler 将减少 Neocloud 采购并直接竞争企业业务
- 伯恩斯坦预计 CoreWeave 2026 年底前至 2027 年底还将签署约 $450 亿 增量合同
Hyperscaler 为什么仍签 Neocloud?
- 现有电力容量和上市速度:CoreWeave 拥有挖矿时代遗留的电力资源,且通过长期租约锁定了增量容量
- 短期承诺、能见度有限:相比自建或 15 年租约,5 年 Neocloud 合同承诺更低
- 沙盒和学习机会:CoreWeave 是目前最成熟的 GPU 云运营商,hyperscaler 希望先试用再大规模自建
主要 Hyperscale 协议概览(伯恩斯坦整理)
| 客户 | 供应商 | 时间 | 金额 | 说明 |
|---|---|---|---|---|
| MSFT | CRWV | 2023-03 | $100 亿 | 云计算容量 |
| MSFT | NBIS | 2025-09 | $194 亿 | 计算容量 |
| Meta | CRWV | 2025-09 | $142 亿 | 云计算容量 |
| Meta | CRWV | 2026-04 | $210 亿 | 初始合同延期 |
| Meta | NBIS | 2026-03 | $270 亿 | AI 基础设施 |
| ORCL | Crusoe | 2026-03 | — | Stargate 相关(Oracle 取消后由 MSFT 接手) |
| OpenAI | CRWV | 2025-03 | $119 亿 | 云计算+股票购买 $3.5 亿 |
| OpenAI Stargate | 多伙伴 | 2025-09 | ~$3,000 亿 | Oracle/Crusoe/MSFT/AMD/Broadcom 联合 |
Hyperscaler 电力与容量披露
| 公司 | 时间 | 关键披露 |
|---|---|---|
| Microsoft | 2026-01 | 单季度新增近 1 GW 总容量;过去12个月新增超 2 GW |
| Amazon | 2026-02 | Q4 新增 1 GW+;过去12个月新增 3.9 GW;预计 2027 年底前再翻倍 |
| Oracle | 2026-03 | 已通过合作伙伴锁定未来3年 >10 GW 电力和数据中心容量;>90% 已全额融资 |
| Oracle | 2025-12 | Q2 交付近 400 MW 数据中心容量;GPU 容量环比 +50% |
| Meta | 2025-09 | 部署 6 GW AMD Instinct GPU 跨多代产品;首个 GW+ 集群 Prometheus 2026 年上线 |
| Meta | 2025-01 | 2025 年上线近 1 GW;正在建设 2 GW 或更大的 AI 数据中心 |
| 2026-02 | 2026 全年 CapEx $1,750-1,850 亿 |
电力危机与能源供给
美国电力缺口
- 美国电力系统增速:过去20年几乎每年低于1%,远跟不上数据中心需求
- 新增电力负载:数据中心约占美国新增电力负载的40%
- 年度发电缺口:每年需要增加约80吉瓦发电量,实际仅增长50-60吉瓦,缺口约20吉瓦/年
- 未来5年累计缺口:可能面临约100吉瓦的发电量缺口(当前美国总发电量约1,300吉瓦)
- 20吉瓦缺口概念:相当于2-3个纽约市的发电量水平
发电结构现状
- 新增发电构成:约60%靠天然气发电站,40%靠光伏、风能和储能
- 有效发电量远低于装机量:太阳能容量系数仅约25%,天然气约85%,核能约93%
- 美国电网脆弱:输电网发展缓慢,吸纳新发电站能力不足;建一条新长距离传输线需7-12年
燃气涡轮发电机
- GE Vernova产能:过去10年增长平缓,峰值年产能约70-100台(每台30-50兆瓦)
- xAI已横扫美国约70%以上的燃气涡轮发电机库存,孟菲斯Colossus-2数据中心有160台涡轮发电机
- GE 2028年后才能接新订单
- 航空衍生燃气轮机(如Caterpillar):产能build up周期长,十台小型仅抵一台300兆瓦大型机
变压器短缺
- 交期:从3个月涨到18-24个月
- 核心材料:取向型硅钢,美国仅一家公司可生产(年产能25万吨),中国宝钢一家约200万吨
- 美国政策限制:2016、2020、2024年出台反倾销/《大而美法案》限制从中国进口,但本土制造业无法承接需求
核能展望
- 存量核能:占美国发电约20%,但均为过去几十年的存量
- 新增核能:预计2028年左右上线
- SMR(小型模块化反应堆):预计2030年左右成为主力
- Oklo:Sam Altman投资的小型核裂变反应堆公司,股价短期暴涨反映市场期待
数据中心技术趋势
供电架构演进
- 当前主流:415V交流→54V直流
- 过渡方案:±400V HVDC(微软、谷歌、Meta)
- 长期方向:800V HVDC(英伟达主推,2027年全面采用)
- 终极方案:固态变压器(SST)直接在数据中心入口将10kV交流转为800V直流
冷却方案
- 液冷已成为高密度算力(>40-50kW/rack)的必需选择
- 2025年美国数据中心用电量约占全美用电量5%,预计2030年翻倍
- 用水量与用电量此消彼长,选址需权衡当地禀赋
规模经济
- Google数据:在爱荷华州建1吉瓦 AI Data Center,比分布式一年可省5亿美元运营成本
- 集群规模从万卡→十万卡→百万卡演进,单次训练时间从季度压缩到周级别
应用结构变化
- 训练 vs 推理占比:今年早些时候已转为推理占比更高(约60%推理、40%训练),之后推理可能占80%以上
- 数据中心选址策略:
- 训练数据中心:不需要离大城市太近,可靠性要求较低(99.9%即可),可建在能源丰富地区
- 推理/云数据中心:需达到"5个9"可靠性(99.999%),通常靠近用户
本次摄取变更
来源:伯恩斯坦——CoreWeave: 对数据中心容量的"土地争夺"仍在继续…人人都想要吉瓦(GW)!.pdf(2026-04-14)
| Diff 类型 | 说明 | 严重程度 |
|---|---|---|
| 新增指标 | 全球数据中心容量基准:当前 ~100 GW,2030E ~190 GW(基准)/ ~220 GW(高需求) | high |
| 新增指标 | Hyperscalers 当前自有 ~40 GW,已宣布 2030 前新增 ~30 GW | high |
| 新增指标 | 容量获取策略四层框架(自建→整栋租赁→Colo→Neocloud) | normal |
| 新增指标 | Meta 与 CoreWeave $210 亿 追加订单、Anthropic 新多年期协议 | high |
| 新增指标 | Hyperscaler 电力/容量披露汇总表(MSFT/AMZN/ORCL/META/GOOG) | normal |
| 预测偏差 | 数据中心供需缓解时点:伯恩斯坦预测 2028 年(极乐观则 2029) | high |
| 关系变化 | CoreWeave 合同结构:"take or pay" GPU 容量承诺,Meta 即使自建上线也需付费 | normal |
信息来源
| 日期 | 来源文件 | 核心内容 | 信源权重 |
|---|---|---|---|
| 2026-04-14 | 伯恩斯坦——CoreWeave: 对数据中心容量的"土地争夺"仍在继续…人人都想要吉瓦(GW)!.pdf |
全球 DC 容量预测、土地争夺框架、Neocloud 长期风险、Hyperscaler 电力披露 | 🟢 high |
| 2025-11-14 | AI数据中心的万亿大基建时代 |
OpenAI/xAI/Meta/微软投资规模、电力危机详细分析、燃气涡轮机/变压器短缺、800V HVDC技术演进、中美电网建设对比、训练vs推理结构变化 | 🟡 medium |
| 2026-01-04 | Semianalysis:AI如何解决电力危机.pdf |
PDF文件,仅记录引用,未提取详细内容 | 🟢 high |
| 2026-02-12 | CITI-Vertiv Holdings Co.pdf |
PDF文件,仅记录引用,未提取内容 | 🟢 high |
[2026-04-18] lint | 补充交叉引用,新增 5 个 outgoing link(液冷、HVDC、谷歌、英伟达)
本页面由 LLM 基于原始剪报自动整理生成,最后更新:2026-04-18
原页面:超节点
超节点(SuperNode)
一句话定义:面向大模型训练与推理设计的新一代整机柜级一体化 AI 算力基础设施,通过芯片级高速互联、统一液冷供电与集中式管理,将多机柜上万颗芯片组成的集群在使用上如同一台巨型超级计算机。
核心定义
超节点将数十到数百颗 GPU/NPU 在物理与逻辑层面深度紧耦合:
- 自研高速互联协议
- 全局统一内存
- 整机柜级供配电与散热体系
- 让万卡集群如同一台巨型超级计算机
解决的问题
传统服务器集群在大模型训练中遇到三大瓶颈:
- 通信墙:传统以太网与 PCIe 组网时延高、带宽不足,万卡集群算力利用率大幅下降
- 功耗墙:高密度 AI 芯片功耗飙升,风冷无法满足散热需求
- 复杂度墙:松散堆叠的服务器部署复杂、故障点多、调度效率低
海外方案
国产方案(2024-2026)
| 产品 | 厂商 | 规格 | 互联协议 |
|---|---|---|---|
| ETH-X | 腾讯 | 单机柜 64 颗 GPU | 以太网 RoCE |
| Atlas A3 900 SuperPoD | 华为 | 最大 384 颗昇腾 910 NPU | 自研 LQC 协议 |
| 磐久 AL128 | 阿里 | 128-144 卡 | 自研 ALink 协议 |
| ScaleX640 | 中科曙光 | 640 卡规模 | 自研 ScaleFabric |
| 大禹超节点 | 字节跳动 | 64-128 卡 | 自研 EthLink |
| ScaleX40 | 中科曙光 | 40 卡无线缆架构 | — |
| Atlas A3 950 SuperPod | 华为 | 8192 颗昇腾 950 NPU | — |
Scale Up 主流协议
国际:封闭 vs 开放双轨
| 协议 | 主导方 | 特点 |
|---|---|---|
| NVLink | 英伟达 | 封闭生态,单 Pod 576 GPU,极致性能 |
| UALink | AMD | 开源,单 Pod 1024 GPU,多厂商兼容 |
| SUE | 博通 | 基于以太网,兼容现有基础设施 |
国内:三条技术路线
- 自主可控专用总线:华为灵衢(UnifiedBus)、海光 HSL
- 以太网优化:字节 EthLink、腾讯 Eth-X
- 开放基础设施:中国移动 OISA 协议
国产交换芯片玩家
独立交换芯片厂商
| 公司 | 产品 | 特点 |
|---|---|---|
| 盛科通信 | 12.8T/25.6T 交换芯片 | 国内领先,已导入主流设备商 |
| 数渡科技 | PCIe 5.0 交换芯片 | 国内极少数掌握自主设计能力 |
| 澜起科技 | PCIe 6.x/CXL 3.x Retimer | 高速互连领域不断拓展 |
大厂自研
| 公司 | 产品 | 特点 |
|---|---|---|
| 华为 | CloudEngine XH9230(51.2T) | 自研 Solar 系列交换芯片 |
| 海光信息 | HSL 协议开放生态 | CPU+DCU+Switch 互联全覆盖 |
| 中兴通讯 | 自研 AI 交换芯片 | 超节点方案已推出 |
| 新华三 | 智擎系列 NP 芯片 | 1.2Tbps 接口吞吐 |
国产超节点三次跃迁(2025-2026)
| 时间 | 产品 | 厂商 | 规格 | 意义 |
|---|---|---|---|---|
| 2025年初 | 昇腾384 | 华为 | 12机柜,384卡 | 打破AI算力互联瓶颈,国产超节点元年 |
| 2025年中 | 磐久AL128 | 阿里 | 单柜128卡 | 算力集成度达昇腾384的4倍 |
| 2025年底 | scaleX640 | 中科曙光 | 单柜640卡 | 世界首个单机柜级640卡,算力集成度达384的20倍 |
scaleX640关键指标:
- 16个scaleX640互联 = 10240卡,总算力突破5EFlops
- 自研scaleFabric高速网络,400Gb/s带宽,端侧延迟<1微秒
- 浸没相变液冷,PUE低至1.04
- 兼容寒武纪、壁仞、登临等多品牌加速卡
- 已适配400+主流大模型和AI框架
国产技术路线分化
| 路线 | 代表厂商 | 特点 |
|---|---|---|
| 封闭全栈 | 华为昇腾 | 纵向一体化,系统一致性高,生态兼容受限 |
| 开放架构 | 曙光、浪潮、阿里 | 多芯片共存,算力生态多元化 |
去英伟达化进展:
- 华为CM384已出货多套,贵州数据中心运营
- 浪潮SD200已商用,支撑DeepSeek/Kimi
- 阿里磐久128承担多模型协作基础设施
- 曙光scaleX640落地上海、杭州智算中心
昇腾超节点架构特点
| 配置项 | 规格 |
|---|---|
| 机柜总数 | 16个(4互联总线柜+12服务器柜) |
| 机柜高度 | 47U非标准,2.2米(高于标准42U) |
| 芯片数量 | 384颗NPU(满配) |
| 服务器配置 | 单个计算柜4台10U高950服务器 |
| 互联交换机 | 400G高速交换机 |
| 定价 | 满配1.3-1.5亿元/套 |
出货情况:截至2026春节前交付550套,覆盖30+行业,总销售额700亿+人民币。
投资建议(东吴电子)
重点推荐:盛科通信、海光信息 建议关注:中兴通讯、澜起科技、万通发展(数渡科技)
信息来源
| 日期 | 来源文件 | 核心内容 | 信源权重 |
|---|---|---|---|
| 2026-04-07 | 【东吴电子陈海进】超节点系列报告一:国产超节点方案量产元年,看好以太网成为主流技术路径.md |
国产超节点方案、协议路线、芯片玩家 | 🟡 medium |
| 2026-03-27 | 国产算力的开放时刻:超节点迈入万卡纪元.md |
国产万卡超节点、开放架构、去英伟达化 | 🟡 medium |
| 2026-01-06 | 国产超节点推陈出新,性能+生态壁垒双双攻克!.md |
国产超节点三次跃迁、scaleX640指标 | 🟡 medium |
| 2026-03-27 | 昇腾芯片950.md |
昇腾超节点硬件配置、定价与出货 | 🟡 medium |
[2026-04-18] lint | 补充交叉引用,新增 5 个 outgoing link(英伟达、昇腾芯片、液冷、DeepSeek)
本页面由 LLM 基于原始剪报自动整理生成,最后更新:2026-04-18