AI算力产业2027-2028供需展望与可见度评估
本报告主要基于 Bernstein、Morgan Stanley、Goldman Sachs、Barclays、UBS、Bank of America、J.P. Morgan、台积电技术论坛、华为官方论文、SemiAnalysis、OpenRouter/a16z 等高/中权重来源,并综合库内
AI基建-半导体、AI基建-存储、AI基建-电力、先进封装、AI应用、AI智能体、华为τ定律深度分析、AI光互联产业链深度分析页面合成。需求端 Token 量化预估含作者推导(已显式标注为推断),并经 Barclays、OpenRouter/a16z 实证、Nvidia 多源外部交叉验证(见 2.4 节)。
核心结论
1. 供给侧能见度远高于需求侧。 截至 2026 年 6 月,晶圆/先进封装/HBM 的产能已通过长约和 capex 承诺锁定到 2028 年(Morgan Stanley 口径表外承诺超 1.3 万亿美元;Goldman Sachs 口径 2026-2031 累计 AI 基建 capex 约 7.6 万亿美元)。2027 年供给账本基本可推算,2028 年供给随良率/电力落地存在弹性。需求侧在"多模态生成 C 端化 + 个人 Agent 全民化"假设下,增长斜率高于供给扩张斜率,能见度低。
2. 算力卡的第一性制程约束,在 2027-2028 不是最紧环节。 台积电 N2 已量产、第一年产出较 N3 高约 45%、2026-2028 产能累计 +70%;建厂节奏从年均 4 座跃升至年均 9 座;全球 WFE 连续上修(2026 $148bn→2028 $198bn)。瓶颈在制程之后的封装与 HBM。
3. 真正卡 2027-2028 的硬约束按紧张度排序:电力 > HBM > 先进封装(CoWoS) > 晶圆制程。 电力的"电-水-金属-并网"提前期以年计(燃气轮机交期 ~4 年、电网接入 5-10 年),HBM 原厂扩产周期 18-24 个月且纪律强、长约锁定,是供应边际改善最慢的两个环节。
4. 最终不是"供给能否满足需求"的二元问题,而是用价格配给、能力配给和效率进步把无上限的潜在需求压回有限供给。 必须区分潜在需求(latent,不受限时用户想消费的 Token)与落地需求(realized,供给配给后实际算出的 Token)——二者的差额就是短缺本身。三个阀门中,单 token 算力成本年化下降 60-70% 是核心释放阀;当前已出现"能力配给"的直接证据(模型厂因算力受限主动降低智能密度)。
4b. 2028 年松紧的总开关是"效率(每 FLOP 产出的 token)",而非芯片数量。 因为:服务能力 = 算力(capex,受电力/HBM 物理封顶,2026→2028 约 2.5×) × 效率(FP4/MoE/投机解码/Rubin,约 10×) ≈ 25×,而潜在 Token 需求在"普通用户 Agent 渗透率跃升 + 多模态生成"高情景下约 20-50×。若潜在落在 ~25× 为紧平衡,落在 ~50× 即明确短缺。难点在于多模态视频生成与长程推理是全新重负载,效率曲线几乎从零起步,恰是最吃算力、效率红利最少的部分。
5. 技术趋势是缓解供给约束的关键变量,且重心正从光刻转向封装/互联/存储。 华为 τ 定律(3D LogicFolding)、ASIC/推理专用芯片、近存计算非 HBM 路线、800VDC/液冷、CPO/分层存储五条路线共同对冲物理天花板。2027-2028 算力供给的边际增量越来越多来自"系统级集成效率"而非"单芯片制程进步"。
6. 可见度判断:2027 年紧平衡(好卡持续供不应求但不崩溃);2028 年若多模态与个人 Agent 假设兑现,结构性短缺概率高,表现为"算力很贵、能力被限速、效率被逼着狂奔",而非"无卡可用"。
正文
一、供给端
1.1 算力卡产出:制程产能约束与扩散信号
算力卡产出第一性受对应制程产能制约。当前证据指向制程产能正在加速扩张,而非见顶:
- N2 已量产:台积电 N2 采用 Nanosheet 架构进入量产,第一年产出较 N3 高约 45%,2026-2028 产能累计增幅看 +70%;缺陷密度提前两季达标,良率学习曲线优于 N3。(来源:台积电技术论坛新竹场 | 权重:🟡 中)
- N3 的 AI 占比快速抬升:N3 节点 AI 加速器需求占比从 2026 年初不到 10% 升至年底约 60%,反映先进制程产能被 AI 强力虹吸。(来源:J.P. Morgan 台积电供应链/旧聚合页 | 权重:🟡 中)
- 最强扩散信号——建厂节奏翻倍:台积电 2025、2026 年平均每年新增 9 座新厂,远高于 2017-2024 年平均每年 4 座。亚利桑那第二厂 2027 年量产 N3,日本熊本第二厂导入 N3,台湾新竹/高雄/台中 12 座晶圆厂与先进封装厂同步兴建。(来源:台积电技术论坛新竹场 | 权重:🟡 中)
- 设备端(WFE)连续上修:Bernstein 全球 WFE 预测 2026 $148bn(+21.4%)→ 2027 $175bn(+18.2%)→ 2028 $198bn(+13.1%),上修主要来自 Memory 扩产;中国 WFE 2026 上修至 $23.5bn(此前 $17.1bn)。(来源:Bernstein | 权重:🟢 高)
- 整机交付量:高盛预计 Nvidia/AMD 机架级 AI 服务器 2026/2027/2028 出货约 5.5 万 / 9 万 / 13.6 万台。(来源:Goldman Sachs | 权重:🟢 高)
判断:算力卡的"第一性制程约束"在 2027-2028 不是最紧环节。晶圆(尤其 N3/N2 逻辑)产能在加速扩张,设备投资连续上修。瓶颈在制程之后。
线索参考(🔴 低,仅供参考):AI 加速器出货量从 2022 年不足 1000 万片增至 2027 年约 2370 万片(微信转述行业会议,需回源高权重研报)。
1.2 产业链各环节供需拆解:供应边际能否提升
按"越靠近可交付整机越是瓶颈"顺序拆解:
环节① 晶圆/逻辑制程 —— 供应边际能提升 ✅ N2 第一年 +45%、三年累计 +70%,叠加建厂翻倍与 WFE 连续上修。这是供应边际最能改善的环节。
环节② 先进封装(CoWoS/SoIC)—— 紧但快速扩,结构性缓解 🟡
- CoWoS 产能 2023-2028 年从 11.8 万片提升至 298.8 万片(约 25×),2026-2028 累计 capex $2000 亿;当前供给缺口仍 15-20%。(来源:J.P. Morgan/旧聚合页 | 🟡 中)
- 单封装集成度指数级提升:最大 5.5× 光罩 CoWoS 量产良率 98%;2028 年推 14× 光罩(整合 20 颗 HBM),2029 年 >14×(24 颗 HBM),SoW 未来可整合 64 颗 HBM。SoIC 互连密度较 2015 年 CoWoS 提升 56 倍,6μm 键合 2025 量产、N2 世代 2028 量产、A14 推进至 4.5μm。(来源:台积电技术论坛新竹场 | 🟡 中)
- 国产侧:CoWoS-S 三梯队(盛合晶微 ~100万/通富微电 ~50万/长电科技 ~30万 颗/年),大陆设计公司年需求 ~400万颗,2027 年供不应求、无价格战风险,2028 待观察;新进入门槛资金 ≥12亿、时间 ≥3年,CoW 固晶设备交期 18 个月是最大瓶颈而非技术。(来源:中国大陆先进封装市场深度访谈纪要 | 🟡 中)
判断:封装产能扩张快于晶圆需求增速,叠加单封装集成度跃升,到 2028 年瓶颈逐步缓解但不消失,缺口从"绝对短缺"转为"结构性偏紧"。
环节③ HBM/存储 —— 最难缓解的供给环节 🔴
- 三大原厂(SK海力士/三星/美光)2026 年 HBM 产能全部售罄,订单排至 2027-2028。(🟡 中)
- 缺口极大:Morgan Stanley 判断 HBM 供需缺口 ~50%,现货/合约价空前背离(DDR5 16G 现货 $39 vs 合约 $91;12GB PCIe 4.0 SSD 现货 $18 vs 合约 $93),紧张预计持续至 2028 年。(来源:Morgan Stanley 转述 | 🟡 中)
- 连带效应:HBM 抽走通用 DRAM 产能,DDR4 供需缺口上修至 2H26 的 19-20%、2027-28 维持 18-20%(来源:Morgan Stanley | 🟢 高);UBS 判断 NAND 价格连涨 6 个季度至 2027Q3,AI 推理为结构性需求(NAND 进入推理系统保留 chat history)(来源:UBS | 🟢 高)。
- 供应边际为何难提升:DRAM/NAND 原厂扩产意愿低,新建/扩产周期 18-24 个月;旺宏设备交期推迟至 27H1、量产爬坡 27H2;LTA 长约覆盖率 18-30% 且条款趋苛(SK 海力士推 5 年以上超长约)。
- 存储 TAM 重估:BofA 预计 HBM 2030 TAM 约 $1683 亿,占加速器支出 14-20%;存储行业一部分正从"现货价格弹性"转向"合约化供应资产"。(来源:Bank of America | 🟡 中)
判断:HBM 是 2027-2028 供给侧最难解的环节。扩产周期长、原厂纪律强、长约锁定,供应边际改善最慢。
线索参考(🔴 低,仅供参考):SK 集团董事长称短缺持续 4-5 年、全球晶圆供应落后需求 20%+;三星称"27 年内存缺口比 26 年更大"(自媒体转述管理层,需回源官方 IR;方向与 MS/UBS 高权重一致)。
环节④ 电力 —— 最硬的物理约束 🔴🔴
- 北美数据中心供需比 3:1,预计 2026 年 10-11 月升至 4:1(史上最紧张);2028-2029 年新建项目将全面转向表后供电(BYOP),16GW 储备中 30% 设计为永不并网。(来源:26年经验数据中心开发CEO专家纪要 | 🟡 中)
- 交期硬约束:重型燃气轮机交期约 4 年,部分州电网接入等待 5-10 年;GE Vernova 在手订单升至 $1630 亿、承接 2031 年及以后订单。(来源:硅谷101论坛/美银/GE Vernova | 🟡 中-高)
- 总量:全球数据中心用电 2025 约 485TWh → 2030 约 950TWh;容量 100GW → 200GW;2028 年后 50%+ 新增 AI 数据中心被迫落地海外。(来源:美银二次整理/专家纪要 | 🟡 中)
- 缓解路线:800VDC 四阶段转型,端到端效率 82.0%→87.4%,1GW 负载 Phase 4 可节电约 69MW;SST 2030 TAM 约 $130 亿。(来源:SemiAnalysis | 🟢 高)
判断:电力是真正卡 2027-2028 的物理天花板。芯片可加速造,但"电-水-金属-并网"提前期以年计,是最难用钱和技术快速解决的一环。
环节⑤ 光互联 —— 结构性偏紧但多路线缓解 🟡
- 1.6T 光模块需求获四源交叉验证上修(2026-2028 出货 +38%/+99%/+88%);光芯片 EML 缺口 >30%,2028 年产能基本锁定。(来源:Morgan Stanley/Goldman Sachs/Lumentum/中际旭创 | 🟢/🟡)
- CPO 大规模商业化是 2028 年后共识,2026-2027 靠可插拔/NPO 过渡;短距铜互连(<7米)延续。(🟢 高,四方验证)
判断:光芯片(磷化铟/EML/CW)是结构性长瓶颈,但模块/铜/CPO 多路线并存,缓解弹性大于 HBM。
二、需求端
2.1 当前消耗结构:编程主导
- 编程是 Token 消耗与商业化跑得最快的单一品类:AI Coding 2026 年 ARR 可能突破 $1000 亿,成为 AI 应用最大单一变现品类。(来源:拾象投研 | 🟡 中)
- ROI 分化决定消耗结构:编程 Agent 日成本约 $13(高 ROI,放量)vs 实时语音客服 Agent 约 $92/天(当前高于外包人工,受抑)。(来源:Goldman Sachs | 🟡 中高)
- 用户基数锚点:ChatGPT WAU ~10 亿、付费 ~5000 万。(来源:拾象投研 | 🟡 中)
含义:当前算力消耗集中在"高 ROI、文本为主、专业用户"的窄口径。多模态 C 端化与个人 Agent 全民化是把消耗从"窄而深"推向"宽而海量"的两个数量级跳变。
线索参考(🔴 低,仅供参考):前沿实验室已将超过一半算力分配到强化学习(SV-Vector 访谈整理)。
2.2 未来假设:多模态生成 + 人手一个 Agent(2027-2028)
两个假设对 Token 需求的放大机制不同:
1. 多模态生成 C 端化 → 单位任务 Token 强度暴涨。 文本 1 次对话约数千 token;一张生成图≈数千~上万 token 当量;一段视频生成≈百万级 token 当量。 2. 人手一个 Agent 个人助理 → 并发用户数 × 常驻时长暴涨。 从"~10 亿周活、按需调用"变为"数十亿常驻、7×24 主动执行(工具调用、长上下文、长期记忆读写)"。
2.3 Token 需求预估
可锚定的量化框架:
- Goldman Sachs 量化模型:2030 年全球 Token 需求或增 24× 至月 120 quadrillion(千万亿);企业级 Agent 为最大乘数(2040 年 55×),消费级 Agent 12×。(来源:Goldman Sachs | 🟡 中高)
- AI 推理 2025-2031 年 CAGR 34%,总需求占比超 50%。(来源:铠侠演讲/微信转述 | 🟡 中)
- Token 经济学剪刀差:LLM Token 价格年降幅从 ~40% 收窄至企稳/上涨,而底层算力成本年化仍降 60-70%。(来源:Goldman Sachs | 🟡 中高)
作者推导(⚠️ 以下为推断,非已验证结论,仅作量级参考;本节倍数指潜在 Token 量 latent,非供给配给后落地量):
将 Goldman Sachs 2030 年 24× 简单年化(24^(1/4)≈2.2×/年)会系统性低估 2027-2028:Agent 在普通用户中的采用是 S 曲线,拐点很可能恰落在这两年;线性年化等于用几何平均去摊一条陡峭曲线。下面改用自下而上重建消费端,把"普通用户 Agent 渗透率"作为独立变量显式建模。
消费端 Token 的乘法分解(以 2026 为基,强度以"偶尔聊天 = 1×"为单位):
| 变量 | 2026 | 2028(高情景) |
|---|---|---|
| 用户基数 | ~10 亿 WAU | ~20 亿 |
| 常驻 Agent 渗透率 | ~5% | ~40% |
| 单用户强度(常驻 Agent vs 偶尔聊天) | 1× | ~30×(7×24 多步执行 vs 每天几条 prompt) |
| 多模态当量乘数(作用于生成切片) | ~1× | ~5×(视频/图像生成单位 token 当量暴涨) |
- 消费段 ≈ +40~50×(渗透率 8× × 强度 30× × 多模态切片乘数,经基数稀释后)
- 编程/专业段 ≈ ~10×(3-5×/年复利)
- 企业 Agent 段 ≈ ~10-15×(高盛口径最大乘数)
按 2026 权重(编程 40% / 消费 40% / 企业 20%)加权:
| 情景 | 2027 潜在 Token 量(vs 2026) | 2028 潜在 Token 量(vs 2026) | 驱动 |
|---|---|---|---|
| 基准(高盛线性外推) | ~2.2× | ~5× | 编程深化+企业Agent起量 |
| 高情景(自下而上,含普通用户渗透) | ~5-8× | ~20-50× | 普通用户 Agent 渗透率 5%→40% × 单用户强度跃升 × 多模态生成乘数 |
说明:本表较初稿(2028 8-15×)显著上修,主因初稿低估了"渗透率 × 单用户强度"的乘法效应,并把多模态当成附加而非乘数。摆动最大的单一变量是普通用户渗透率,其次是多模态乘数(可在 5×~50× 间浮动),故给出 20-50× 的宽区间而非点估计。
但潜在 Token 量 ≠ 落地算力需求。 落地量受供给封顶:
2028 服务能力 = 算力(capex/硬件,受电力/HBM 物理封顶) × 效率(tokens/FLOP)
≈ 2.5×(capex/服务器,电力与 HBM 是硬约束)× ~10×(FP4/MoE/投机解码/Rubin 推理吞吐)
≈ 25×
2028 潜在需求 ≈ 20~50×(含普通用户 Agent 渗透)
- 若潜在落在 ~25× → 紧平衡(效率刚好接住);
- 若潜在落在 ~50× → 明确短缺,缺口靠涨价/限速压平。
真正的题眼因此从"能不能造够芯片"转为"效率能否在两年内做到 ~10× 去接住消费端 Agent 爆发"。 而多模态视频生成与长程推理是全新重负载,效率曲线几乎从零起步,拉低混合效率——这恰是高情景里最吃算力、效率红利最少的部分。
推断结论:普通用户 Agent 渗透率的跃升使 2028 潜在需求上修至 ~20-50×,明显高于供给×效率的服务能力(~25×),结构性短缺的概率因此更高、而非更低。与 CSP capex 轨迹一致(四大 CSP 2026Q1 合计 capex 已超 $6300 亿;GS 年度 AI 基建 capex 2026 $7650亿→2031 $1.636万亿)。
2.4 外部二次源交叉验证(evidence 补强)
为校验上述自建模型,补充库外高/中权重实证与一手来源(2025-2026),对需求侧框架做交叉验证(注:各源单位不同——token 量 / 算力单位 / 单位成本——不可直接相加,仅作方向与量级印证):
| 验证点 | 本报告口径 | 外部源 | 外部数据 | 一致性 |
|---|---|---|---|---|
| 当前消耗"编程主导" | 编程是最大单一品类 | OpenRouter / a16z《State of AI 2025》 | 编程/创意为 token 第一大驱动;编程占比从 2025 初 11% 升至 >50% | ✅ 一致 |
| Agent 驱动 token 暴涨 | 渗透×强度乘法跳变 | OpenRouter / Nvidia | Agentic 为增长最快行为、agents 已占多数输出 token;agentic 系统较传统应用多耗 15× token、推理 token 较单次推理多耗 100× 算力 | ✅ 强一致 |
| Token 量基准 ~4×/年 | 高情景 2027 ~5-8× | OpenRouter 实测 | 吞吐 ~4× YoY(2025-04 周 5T → 2026-04 周 >20T);全市场 ~1.5 quadrillion/月 | ✅ 一致(本报告基准略偏保守) |
| 效率 60-70%/年 | 服务能力 ~10×/2年 | Barclays | 推理单位成本/百万 token 18 个月降 ~90%(≈ −60%/年) | ✅ 一致 |
| 潜在需求 >> 可建供给 | 2028 潜在 20-50× vs 供给 2.5× | Barclays | GPU/ASIC 需求 2025 超共识 250%、2027 达当前 14×;capex 超共识 $225B+(CY27/28) | ✅ 强支持 |
校准结论:外部实证与投行口径全方向印证框架,且多处显示本报告偏保守——
1. 结构性短缺获独立背书:Barclays 的"latent 算力需求 2027 即 14×"与本报告"可建供给 ~2.5×(受电力/HBM 封顶)"并置,二者之差正是短缺缺口,独立佐证核心结论。 2. 效率降幅实证吻合:Barclays 单位成本 −90%/18 月 ≈ 本报告 −60%/年。 3. 高盛 24× 可能偏保守:OpenRouter 全市场当前 ~1.5 quadrillion/月,对照高盛 2030 年 120 quadrillion/月目标隐含 ~80×(口径差异),对本报告 20-50× 构成上行而非下行支撑。
需求侧证据链由"高盛单源"升级为 高盛 + Barclays + OpenRouter 实证 + Nvidia 多源交叉。
三、综合判断:供应能否解决
3.1 供需缺口的本质:潜在 vs 落地,效率是总开关
必须区分两个不同的量——二者之差即短缺:
- 潜在需求(latent):不受限时用户想消费的 Token。高情景下(含普通用户 Agent 渗透率 5%→40%)2028 约 20-50×(见 2.3 节自下而上分解)。
- 落地需求(realized)= 服务能力:供给配给后实际算出的 Token,受物理产能封顶。
三条斜率叠起来:
供给侧(capex/硬件) : 2026→2028 约 2.5×(GS 年度 capex 5 年 ~2.1×;机架级服务器 ~2.5×)——受电力/HBM 物理封顶
效率(tokens/FLOP) : 2026→2028 约 ~10×(单 token 成本 60-70%/年降;FP4/MoE/投机解码/Rubin 推理吞吐)
服务能力 = 供给×效率 : 2026→2028 约 25×
潜在需求(高情景) : 2026→2028 约 20-50×
关键洞察:服务能力的 ~25× 里,效率(~10×)贡献远大于 capex(~2.5×)——因为 capex 被电力和 HBM 死死压住,弹性最低。所以 2028 松紧的总开关是效率能否兑现 ~10×,而非芯片造多少。 若潜在需求落在 ~25× 是紧平衡,落在 ~50× 即明确短缺;且多模态/长程推理这类新负载效率从零起步,最可能让混合效率不及 10×、把天平推向短缺。
两者无法在 2027-2028 自然出清,缺口靠三个阀门压平:
1. 价格配给:算力租赁从"卖卡"转向"token 分成";国内已现 token 涨价/限购线索(🔴 低,待验证)。 2. 能力配给:模型厂因算力受限主动降低 Claude 智能密度,若算力充足不受限收入会显著更高。(来源:Gavin Baker 访谈整理 | 🟡 中)这是"需求被供给压制"的直接证据。 3. 效率进步(核心释放阀):60-70%/年的单位成本下降,是把无限需求装进有限供给的核心机制。
3.2 技术趋势如何缓解供给(题眼)
产业用五条技术路线对冲物理约束:
| 技术趋势 | 缓解环节 | 库内证据 | 权重 |
|---|---|---|---|
| 华为τ定律 / 3D LogicFolding / 先进封装 | 不靠 EUV 提升等效算力密度;投资重心光刻→封装/互联/存储 | Kirin 2026 固定节点下密度 155→238 MTr/mm²(+53.5%)、能效 +41%;先进逻辑 capex 天花板 1000亿→2000亿+ | 🟢/🟡 |
| ASIC / 推理专用芯片 | 降低单位推理成本、分流 GPU | TPU 8i 推理成本降 40-50%;AWS 自研芯片单位成本可达商业 GPU 的 1/10-1/5 | 🟡 中 |
| 近存计算 / 非 HBM 路线 | 绕开 HBM 瓶颈(推理场景) | 高通/字节用近存计算+定制 LPDDR 避开 HBM,对标 TPU 性能 70%/成本 50% | 🟡 中 |
| 800VDC / 液冷 / 表后供电 | 缓解电力与散热 | 800VDC 端到端效率 82%→87.4%,1GW 负载省 ~69MW;SST 2030 TAM ~$130亿 | 🟢 高 |
| CPO / 硅光 / 分层存储 | 缓解互联带宽与存储墙 | Hi-ONE 光引擎 8Tb/s;NAND 进入推理(KV cache/chat history)做分层 | 🟡 中 |
τ定律的产业含义:当几何缩放(光刻)逼近物理与地缘双重天花板,产业的"下一块钱跟着 τ 走、不跟着 node 走"——用封装/互联/存储换时间。2027-2028 算力供给的边际增量越来越多来自系统级集成效率。对中国尤为关键:在无 EUV 约束下 τ 路线提供可持续 narrow the gap 的路径(Bernstein 提醒:不会立即 close the gap,热约束与良率是 adoption 障碍)。
3.3 最终裁断
- 2027 年:供给能见度高(产能/HBM/封装已锁定到 2028),需求以编程+早期 Agent 为主仍可外推。紧平衡,靠涨价+效率维持,不出现崩溃式短缺,但好卡持续供不应求。
- 2028 年:若"多模态 C 端化 + 个人 Agent 全民化"假设兑现,潜在需求系统性超过供给扩张。供给侧无法在硬约束(电力 4-5 年提前期、HBM 4-5 年短缺)内全额满足,必以价格/能力配给+效率进步压平。结构性短缺概率高,表现为"算力很贵、能力被限速、效率被逼着狂奔",而非"无卡可用"。
- 真正决定 2028 年松紧的不是芯片,是电力和 HBM。 芯片可加速造,电网与 HBM 原厂的产能弹性最低。
四、受益环节映射(按瓶颈紧张度分层)
把核心结论(硬约束 电力>HBM>CoWoS>制程 + 效率是总开关)映射到利润池与库内标的。利润池迁移判断:在"效率是总开关"框架下,价值从"单芯片制程"向"系统级集成(封装/互联/存储/电力)"再分配,与 τ定律"下一块钱跟着 τ 走"一致——最稀缺利润池在电力与 HBM(供应弹性最低),最确定成长在先进封装与光互联(需求确定+国产替代双驱动)。
| 瓶颈层级 | 利润池逻辑 | 受益环节 | 库内标的(权重见各页) |
|---|---|---|---|
| ①电力(最紧) | 提前期最长、议价权最强、最稀缺 | 燃气轮机/电网/变压器/SOFC/800VDC | GEV(在手1630亿)、VRT、BE(SOFC);新雷能(800V,🔴低) |
| ②HBM/存储 | 原厂纪律+长约锁价,周期品→合同资产 | HBM/DRAM/NAND/eSSD | MU、SK海力士、三星、STX、Kioxia(UBS);国产 兆易创新、长鑫(IPO) |
| ③先进封装 CoWoS | 2027供不应求、设备交期18个月 | 2.5D/3D封装/混合键合/TSV | 长电科技、盛合晶微(未上市)、通富;设备 拓荆科技(键合)、中微公司(TSV)、北方华创 |
| ④晶圆制程(最松) | 产能在扩,alpha 在国产替代 | 代工/WFE | TSM、中芯国际;设备 KLAC/AMAT/北方华创 |
| 效率总开关 | 决定服务能力能否接住需求 | ASIC/光互联/CPO/液冷 | AVGO/GOOGL(ASIC/TPU)、MRVL、中际旭创/新易盛、工业富联(CPO)、胜宏科技/深南电路(PCB) |
| 算力卡/租赁(需求承接) | 终端算力变现 | GPU/AI云/国产芯片 | NVDA、AMD、CoreWeave、寒武纪/海光信息 |
五、反方情景:2028 为何可能不短缺(证伪路径)
主线判断是"2028 结构性短缺概率高",但必须列出可能翻转结论的反方路径:
1. 效率超预期接住需求(最强反方):若 FP4/MoE/蒸馏/投机解码 + Rubin 推理吞吐使 tokens/FLOP 两年做到 >10×(而非 ≤10×),服务能力可逼近甚至超过潜在需求上沿,转为紧平衡。Rubin 推理吞吐较 Blackwell 宣称提升 35×是潜在上行(🟡 中,宣称值,实测待验证)。 2. 需求假设证伪:多模态 C 端生成渗透慢于预期、个人 Agent 留存/付费不及预期、高盛 24× 本身过乐观——则潜在需求回落到 ~5-10×,供给转宽松(关联 AI应用 页 TODO-20260507-AI应用-08)。 3. AI capex 消化/泡沫:MS 表外承诺 1.3 万亿、Meta 租赁+采购约未来经营现金流 1.7 倍/Oracle 超 7 倍——若收入确认持续落后估值,capex 增速可能下修,需求侧自我修正。 4. 大摩"科技通胀"路径:2H26 晶圆/封测/存储成本飙升传导至终端涨价,PC/手机需求破坏,消费电子端芯片/存储需求回落,间接释放产能。 5. ASIC+近存计算等效扩容:推理 ASIC(TPU 8i 成本 -40-50%)+近存计算(高通/字节绕 HBM)大幅降低单位推理算力成本,等效把有限晶圆/HBM 摊出更多推理算力。
反方权重判断:路径 1(效率)与路径 2(需求证伪)是真正能翻转结论的两条;路径 3/4/5 更多是缓解而非逆转。因此本报告的短缺判断对两个变量最敏感——效率兑现度 与 普通用户 Agent 渗透的真实斜率;二者任一显著偏离,结论即需重估。
六、信源冲突提示
| 议题 | 来源A | 来源B | 权重 |
|---|---|---|---|
| ASIC 是否"去英伟达化" | AWS/Google:自研 ASIC 加速放量、成本优势驱动替代 | BofA:NVDA 2030 仍维持 65-70% 份额,ASIC 是增量非线性替代 | 🟡/🟢 |
| GPU:CPU 配比 | 南方基金:由 1:8 → 1:1 或 1:2 | 全球CPU专家纪要:不认同 1:1,维持 1:4-1:8 | 🟡/🟡 |
| 存储周期下半年走向 | Morgan Stanley:2H26"科技通胀"抑制终端需求,存储涨价或放缓 | SK董事长/UBS:短缺持续 4-5 年 / NAND 涨至 2027Q3 | 🟡/🟢 |
冲突未消解,呈现分歧供判断。其中 ASIC 替代度与 GPU:CPU 配比直接影响算力卡的需求结构测算。
七、关键跟踪变量
| 变量 | 跟踪指标 | 频率 | 触发动作 | 反证方向 |
|---|---|---|---|---|
| 电力(最硬约束) | 北美供需比、燃气轮机/变压器交期、表后供电渗透 | 季度 | 破 4:1 → 强化短缺判断 | 并网提速、需求放缓 |
| HBM | HBM4/4E 量产节点、现货-合约价差、原厂扩产 | 季度 | 价差扩大 → 短缺加深 | 价差收敛、扩产超预期 |
| CoWoS | 国内三梯队爬坡 vs ~400万颗需求、CoW 固晶 18 月交期、台积电产能 | 半年 | 需求>产能 → 2027供不应求兑现 | 产能超需求、价格战 |
| 需求斜率 | 多模态 C 端渗透、个人 Agent 留存/付费、高盛 24× vs OpenRouter/火山实测 | 季度 | 实测>外推 → 上修潜在需求 | 渗透慢、付费弱(关联 TODO-20260507-AI应用-08) |
| 效率(总开关) | tokens/FLOP 年降幅、Rubin 实测吞吐、FP4/MoE 采用率 | 季度 | <10× → 短缺;>10× → 紧平衡 | 效率超预期接住需求 |
| ASIC 份额 | NVDA 加速器份额、TPU/Trainium 出货 | 季度 | 验证"去英伟达化"分歧 | NVDA 维持 65-70% |
信息来源
| 来源 | 权重 | 类型 | 核心贡献 |
|---|---|---|---|
| Bernstein(全球 WFE / 半导体设备 / τ定律解读) | 🟢 高 | 投行研报 | WFE 2026-2028 连续上修($148bn→$198bn);中国 WFE 上修;τ定律"another DeepSeek moment"与三层约束 |
| Morgan Stanley(HBM/DDR4/China AI 2.0/表外承诺) | 🟢 高 | 投行研报 | HBM 缺口 ~50%、现货-合约价背离;DDR4 缺口上修 19-20%;表外承诺 1.3 万亿;中国 AI 从训练转推理 |
| Goldman Sachs(Agentic Token/机架级服务器/AI 基建 capex) | 🟡 中高 | 投行研报 | Token 2030 +24x、消费 Agent 12x;机架级服务器 5.5万/9万/13.6万台;2026-2031 capex ~7.6 万亿;Agent ROI 分化 |
| Barclays(The next wave of AI / AI capex) | 🟢 高 | 投行研报(外部补证) | GPU/ASIC 需求 2025 超共识 250%、2027 达当前 14×;推理单位成本/百万 token 18 月降 ~90%;capex 超共识 $225B+(CY27/28) |
| OpenRouter / a16z(State of AI 2025,100T token 实证研究) | 🟢 高 | 实证研究(外部补证) | Token 吞吐 ~4× YoY;全市场 ~1.5 quadrillion/月;编程占比 11%→>50%;agentic 为最快增长、占多数输出 token |
| Nvidia(GTC / 推理技术披露) | 🟡 中 | 厂商技术口径(外部补证) | 推理 token 较单次推理多耗 100× 算力;agentic 系统多耗 15× token;Blackwell 单 token 成本降一个数量级、Rubin 延续 |
| UBS(Kioxia initiation/NAND) | 🟢 高 | 投行研报 | NAND 价格连涨 6 季至 2027Q3;AI 推理为结构性 NAND 需求;Kioxia 成本优势 |
| Bank of America(半导体 SOTU/HBM TAM) | 🟢 高 | 投行研报 | AI 数据中心系统 TAM 2030 ~$1.7T;HBM 2030 TAM ~$1683 亿;NVDA 2030 维持 65-70% 份额 |
| J.P. Morgan(台积电及先进封装供应链) | 🟢 高 | 投行研报 | CoWoS 产能 11.8万→298.8万片、缺口 15-20%、客户分配;先进封装交付瓶颈框架 |
| 台积电技术论坛(新竹场) | 🟡 中 | 现场报道 | N2 量产/+45%/+70%;全球建厂年均 9 座;CoWoS 良率 98% 与光罩演进;SoIC 路线 |
| 华为官方论文(IEEE ISCAS 2026,τ定律) | 🟡 中 | 学术论文/一手 | LogicFolding 密度 +53.5%/能效 +41%;3D Folding 解决 N² vs N;投资重心从光刻转封装/互联/存储 |
| SemiAnalysis(800VDC/AI 暗产出) | 🟢 高 | 产业研究 | 800VDC 四阶段、效率 82%→87.4%、SST 2030 TAM $130亿;暗产出 ~$1.5T 替代潜力框架 |
| GE Vernova(电力设备订单) | 🟡 中 | 公司财报 | 燃气轮机交期/订单;在手订单 $1630 亿;承接 2031 年后订单 |
| 数据中心开发 CEO 专家纪要 | 🟡 中 | 专家纪要 | 北美供需比 3:1→4:1;表后供电主流化;单 MW capex;区域格局;国际化转向 |
| 美银(数据中心电力二次整理) | 🟡 中 | 投行二次整理 | 全球数据中心用电 485TWh→950TWh;1GW capex ~$500 亿;并网等待 5-10 年 |
| 中国大陆先进封装市场深度访谈纪要 | 🟡 中 | 专家访谈 | 国内 CoWoS-S/L 三梯队产能;2027 供不应求;新进入门槛与设备交期 18 个月 |
| Lumentum / 中际旭创 / AI 光互联交叉验证 | 🟡 中 | 调研+研报 | 1.6T 上修;EML 缺口 >30%;CPO 2028 年后规模化;铜互连短距延续 |
| 拾象投研(AGI 投资洞察) | 🟡 中 | 一级市场研究 | AI Coding 2026 ARR ~$1000 亿;ChatGPT WAU ~10亿/付费 5000万;模型商业模式向 Runtime 迁移 |
| 铠侠 / SDC StorageAI 大会(微信转述) | 🟡 中 | 行业会议转述 | AI 推理存储 CAGR 34%、占比超 50%;分层存储趋势 |
| Gavin Baker 访谈整理 | 🟡 中 | 访谈整理 | 模型厂因算力受限降低智能密度(能力配给的直接证据) |
| 自媒体/社群转述管理层(SK董事长/三星/token涨价限购) | 🔴 低 | 自媒体转述 | 仅作线索参考:短缺 4-5 年、27 缺口 >26、国内 token 涨价限购,需回源官方 IR |