AI算力产业2027-2028供需展望与可见度评估

本报告主要基于 Bernstein、Morgan Stanley、Goldman Sachs、Barclays、UBS、Bank of America、J.P. Morgan、台积电技术论坛、华为官方论文、SemiAnalysis、OpenRouter/a16z 等高/中权重来源，并综合库内 AI基建-半导体、AI基建-存储、AI基建-电力、先进封装、AI应用、AI智能体、华为τ定律深度分析、AI光互联产业链深度分析 页面合成。需求端 Token 量化预估含作者推导（已显式标注为推断），并经 Barclays、OpenRouter/a16z 实证、Nvidia 多源外部交叉验证（见 2.4 节）。

核心结论

1. 供给侧能见度远高于需求侧。 截至 2026 年 6 月，晶圆/先进封装/HBM 的产能已通过长约和 capex 承诺锁定到 2028 年（Morgan Stanley 口径表外承诺超 1.3 万亿美元；Goldman Sachs 口径 2026-2031 累计 AI 基建 capex 约 7.6 万亿美元）。2027 年供给账本基本可推算，2028 年供给随良率/电力落地存在弹性。需求侧在"多模态生成 C 端化 + 个人 Agent 全民化"假设下，增长斜率高于供给扩张斜率，能见度低。

2. 算力卡的第一性制程约束，在 2027-2028 不是最紧环节。 台积电 N2 已量产、第一年产出较 N3 高约 45%、2026-2028 产能累计 +70%；建厂节奏从年均 4 座跃升至年均 9 座；全球 WFE 连续上修（2026 $148bn→2028 $198bn）。瓶颈在制程之后的封装与 HBM。

3. 真正卡 2027-2028 的硬约束按紧张度排序：电力 > HBM > 先进封装(CoWoS) > 晶圆制程。 电力的"电-水-金属-并网"提前期以年计（燃气轮机交期 ~4 年、电网接入 5-10 年），HBM 原厂扩产周期 18-24 个月且纪律强、长约锁定，是供应边际改善最慢的两个环节。

4. 最终不是"供给能否满足需求"的二元问题，而是用价格配给、能力配给和效率进步把无上限的潜在需求压回有限供给。 必须区分潜在需求（latent，不受限时用户想消费的 Token）与落地需求（realized，供给配给后实际算出的 Token）——二者的差额就是短缺本身。三个阀门中，单 token 算力成本年化下降 60-70% 是核心释放阀；当前已出现"能力配给"的直接证据（模型厂因算力受限主动降低智能密度）。

4b. 2028 年松紧的总开关是"效率（每 FLOP 产出的 token）"，而非芯片数量。 因为：服务能力 = 算力(capex，受电力/HBM 物理封顶，2026→2028 约 2.5×) × 效率(FP4/MoE/投机解码/Rubin，约 10×) ≈ 25×，而潜在 Token 需求在"普通用户 Agent 渗透率跃升 + 多模态生成"高情景下约 20-50×。若潜在落在 ~25× 为紧平衡，落在 ~50× 即明确短缺。难点在于多模态视频生成与长程推理是全新重负载，效率曲线几乎从零起步，恰是最吃算力、效率红利最少的部分。

5. 技术趋势是缓解供给约束的关键变量，且重心正从光刻转向封装/互联/存储。 华为 τ 定律（3D LogicFolding）、ASIC/推理专用芯片、近存计算非 HBM 路线、800VDC/液冷、CPO/分层存储五条路线共同对冲物理天花板。2027-2028 算力供给的边际增量越来越多来自"系统级集成效率"而非"单芯片制程进步"。

6. 可见度判断：2027 年紧平衡（好卡持续供不应求但不崩溃）；2028 年若多模态与个人 Agent 假设兑现，结构性短缺概率高，表现为"算力很贵、能力被限速、效率被逼着狂奔"，而非"无卡可用"。

正文

一、供给端

1.1 算力卡产出：制程产能约束与扩散信号

算力卡产出第一性受对应制程产能制约。当前证据指向制程产能正在加速扩张，而非见顶：

N2 已量产：台积电 N2 采用 Nanosheet 架构进入量产，第一年产出较 N3 高约 45%，2026-2028 产能累计增幅看 +70%；缺陷密度提前两季达标，良率学习曲线优于 N3。（来源：台积电技术论坛新竹场 | 权重：🟡 中）
N3 的 AI 占比快速抬升：N3 节点 AI 加速器需求占比从 2026 年初不到 10% 升至年底约 60%，反映先进制程产能被 AI 强力虹吸。（来源：J.P. Morgan 台积电供应链/旧聚合页 | 权重：🟡 中）
最强扩散信号——建厂节奏翻倍：台积电 2025、2026 年平均每年新增 9 座新厂，远高于 2017-2024 年平均每年 4 座。亚利桑那第二厂 2027 年量产 N3，日本熊本第二厂导入 N3，台湾新竹/高雄/台中 12 座晶圆厂与先进封装厂同步兴建。（来源：台积电技术论坛新竹场 | 权重：🟡 中）
设备端（WFE）连续上修：Bernstein 全球 WFE 预测 2026 $148bn（+21.4%）→ 2027 $175bn（+18.2%）→ 2028 $198bn（+13.1%），上修主要来自 Memory 扩产；中国 WFE 2026 上修至 $23.5bn（此前 $17.1bn）。（来源：Bernstein | 权重：🟢 高）
整机交付量：高盛预计 Nvidia/AMD 机架级 AI 服务器 2026/2027/2028 出货约 5.5 万 / 9 万 / 13.6 万台。（来源：Goldman Sachs | 权重：🟢 高）

判断：算力卡的"第一性制程约束"在 2027-2028 不是最紧环节。晶圆（尤其 N3/N2 逻辑）产能在加速扩张，设备投资连续上修。瓶颈在制程之后。

线索参考（🔴 低，仅供参考）：AI 加速器出货量从 2022 年不足 1000 万片增至 2027 年约 2370 万片（微信转述行业会议，需回源高权重研报）。

1.2 产业链各环节供需拆解：供应边际能否提升

按"越靠近可交付整机越是瓶颈"顺序拆解：

环节① 晶圆/逻辑制程 —— 供应边际能提升 ✅ N2 第一年 +45%、三年累计 +70%，叠加建厂翻倍与 WFE 连续上修。这是供应边际最能改善的环节。

环节② 先进封装（CoWoS/SoIC）—— 紧但快速扩，结构性缓解 🟡

CoWoS 产能 2023-2028 年从 11.8 万片提升至 298.8 万片（约 25×），2026-2028 累计 capex $2000 亿；当前供给缺口仍 15-20%。（来源：J.P. Morgan/旧聚合页 | 🟡 中）
单封装集成度指数级提升：最大 5.5× 光罩 CoWoS 量产良率 98%；2028 年推 14× 光罩（整合 20 颗 HBM），2029 年 >14×（24 颗 HBM），SoW 未来可整合 64 颗 HBM。SoIC 互连密度较 2015 年 CoWoS 提升 56 倍，6μm 键合 2025 量产、N2 世代 2028 量产、A14 推进至 4.5μm。（来源：台积电技术论坛新竹场 | 🟡 中）
国产侧：CoWoS-S 三梯队（盛合晶微 ~100万/通富微电 ~50万/长电科技 ~30万 颗/年），大陆设计公司年需求 ~400万颗，2027 年供不应求、无价格战风险，2028 待观察；新进入门槛资金 ≥12亿、时间 ≥3年，CoW 固晶设备交期 18 个月是最大瓶颈而非技术。（来源：中国大陆先进封装市场深度访谈纪要 | 🟡 中）

判断：封装产能扩张快于晶圆需求增速，叠加单封装集成度跃升，到 2028 年瓶颈逐步缓解但不消失，缺口从"绝对短缺"转为"结构性偏紧"。

环节③ HBM/存储 —— 最难缓解的供给环节 🔴

三大原厂（SK海力士/三星/美光）2026 年 HBM 产能全部售罄，订单排至 2027-2028。（🟡 中）
缺口极大：Morgan Stanley 判断 HBM 供需缺口 ~50%，现货/合约价空前背离（DDR5 16G 现货 $39 vs 合约 $91；12GB PCIe 4.0 SSD 现货 $18 vs 合约 $93），紧张预计持续至 2028 年。（来源：Morgan Stanley 转述 | 🟡 中）
连带效应：HBM 抽走通用 DRAM 产能，DDR4 供需缺口上修至 2H26 的 19-20%、2027-28 维持 18-20%（来源：Morgan Stanley | 🟢 高）；UBS 判断 NAND 价格连涨 6 个季度至 2027Q3，AI 推理为结构性需求（NAND 进入推理系统保留 chat history）（来源：UBS | 🟢 高）。
供应边际为何难提升：DRAM/NAND 原厂扩产意愿低，新建/扩产周期 18-24 个月；旺宏设备交期推迟至 27H1、量产爬坡 27H2；LTA 长约覆盖率 18-30% 且条款趋苛（SK 海力士推 5 年以上超长约）。
存储 TAM 重估：BofA 预计 HBM 2030 TAM 约 $1683 亿，占加速器支出 14-20%；存储行业一部分正从"现货价格弹性"转向"合约化供应资产"。（来源：Bank of America | 🟡 中）

判断：HBM 是 2027-2028 供给侧最难解的环节。扩产周期长、原厂纪律强、长约锁定，供应边际改善最慢。

线索参考（🔴 低，仅供参考）：SK 集团董事长称短缺持续 4-5 年、全球晶圆供应落后需求 20%+；三星称"27 年内存缺口比 26 年更大"（自媒体转述管理层，需回源官方 IR；方向与 MS/UBS 高权重一致）。

环节④ 电力 —— 最硬的物理约束 🔴🔴

北美数据中心供需比 3:1，预计 2026 年 10-11 月升至 4:1（史上最紧张）；2028-2029 年新建项目将全面转向表后供电（BYOP），16GW 储备中 30% 设计为永不并网。（来源：26年经验数据中心开发CEO专家纪要 | 🟡 中）
交期硬约束：重型燃气轮机交期约 4 年，部分州电网接入等待 5-10 年；GE Vernova 在手订单升至 $1630 亿、承接 2031 年及以后订单。（来源：硅谷101论坛/美银/GE Vernova | 🟡 中-高）
总量：全球数据中心用电 2025 约 485TWh → 2030 约 950TWh；容量 100GW → 200GW；2028 年后 50%+ 新增 AI 数据中心被迫落地海外。（来源：美银二次整理/专家纪要 | 🟡 中）
缓解路线：800VDC 四阶段转型，端到端效率 82.0%→87.4%，1GW 负载 Phase 4 可节电约 69MW；SST 2030 TAM 约 $130 亿。（来源：SemiAnalysis | 🟢 高）

判断：电力是真正卡 2027-2028 的物理天花板。芯片可加速造，但"电-水-金属-并网"提前期以年计，是最难用钱和技术快速解决的一环。

环节⑤ 光互联 —— 结构性偏紧但多路线缓解 🟡

1.6T 光模块需求获四源交叉验证上修（2026-2028 出货 +38%/+99%/+88%）；光芯片 EML 缺口 >30%，2028 年产能基本锁定。（来源：Morgan Stanley/Goldman Sachs/Lumentum/中际旭创 | 🟢/🟡）
CPO 大规模商业化是 2028 年后共识，2026-2027 靠可插拔/NPO 过渡；短距铜互连（<7米）延续。（🟢 高，四方验证）

判断：光芯片（磷化铟/EML/CW）是结构性长瓶颈，但模块/铜/CPO 多路线并存，缓解弹性大于 HBM。

二、需求端

2.1 当前消耗结构：编程主导

编程是 Token 消耗与商业化跑得最快的单一品类：AI Coding 2026 年 ARR 可能突破 $1000 亿，成为 AI 应用最大单一变现品类。（来源：拾象投研 | 🟡 中）
ROI 分化决定消耗结构：编程 Agent 日成本约 $13（高 ROI，放量）vs 实时语音客服 Agent 约 $92/天（当前高于外包人工，受抑）。（来源：Goldman Sachs | 🟡 中高）
用户基数锚点：ChatGPT WAU ~10 亿、付费 ~5000 万。（来源：拾象投研 | 🟡 中）

含义：当前算力消耗集中在"高 ROI、文本为主、专业用户"的窄口径。多模态 C 端化与个人 Agent 全民化是把消耗从"窄而深"推向"宽而海量"的两个数量级跳变。

线索参考（🔴 低，仅供参考）：前沿实验室已将超过一半算力分配到强化学习（SV-Vector 访谈整理）。

2.2 未来假设：多模态生成 + 人手一个 Agent（2027-2028）

两个假设对 Token 需求的放大机制不同：

1. 多模态生成 C 端化 → 单位任务 Token 强度暴涨。 文本 1 次对话约数千 token；一张生成图≈数千~上万 token 当量；一段视频生成≈百万级 token 当量。 2. 人手一个 Agent 个人助理 → 并发用户数 × 常驻时长暴涨。 从"~10 亿周活、按需调用"变为"数十亿常驻、7×24 主动执行（工具调用、长上下文、长期记忆读写）"。

2.3 Token 需求预估

可锚定的量化框架：

Goldman Sachs 量化模型：2030 年全球 Token 需求或增 24× 至月 120 quadrillion（千万亿）；企业级 Agent 为最大乘数（2040 年 55×），消费级 Agent 12×。（来源：Goldman Sachs | 🟡 中高）
AI 推理 2025-2031 年 CAGR 34%，总需求占比超 50%。（来源：铠侠演讲/微信转述 | 🟡 中）
Token 经济学剪刀差：LLM Token 价格年降幅从 ~40% 收窄至企稳/上涨，而底层算力成本年化仍降 60-70%。（来源：Goldman Sachs | 🟡 中高）

作者推导（⚠️ 以下为推断，非已验证结论，仅作量级参考；本节倍数指潜在 Token 量 latent，非供给配给后落地量）：

将 Goldman Sachs 2030 年 24× 简单年化（24^(1/4)≈2.2×/年）会系统性低估 2027-2028：Agent 在普通用户中的采用是 S 曲线，拐点很可能恰落在这两年；线性年化等于用几何平均去摊一条陡峭曲线。下面改用自下而上重建消费端，把"普通用户 Agent 渗透率"作为独立变量显式建模。

消费端 Token 的乘法分解（以 2026 为基，强度以"偶尔聊天 = 1×"为单位）：

变量	2026	2028（高情景）
用户基数	~10 亿 WAU	~20 亿
常驻 Agent 渗透率	~5%	~40%
单用户强度（常驻 Agent vs 偶尔聊天）	1×	~30×（7×24 多步执行 vs 每天几条 prompt）
多模态当量乘数（作用于生成切片）	~1×	~5×（视频/图像生成单位 token 当量暴涨）

消费段 ≈ +40~50×（渗透率 8× × 强度 30× × 多模态切片乘数，经基数稀释后）
编程/专业段 ≈ ~10×（3-5×/年复利）
企业 Agent 段 ≈ ~10-15×（高盛口径最大乘数）

按 2026 权重（编程 40% / 消费 40% / 企业 20%）加权：

情景	2027 潜在 Token 量(vs 2026)	2028 潜在 Token 量(vs 2026)	驱动
基准（高盛线性外推）	~2.2×	~5×	编程深化+企业Agent起量
高情景（自下而上，含普通用户渗透）	~5-8×	~20-50×	普通用户 Agent 渗透率 5%→40% × 单用户强度跃升 × 多模态生成乘数

说明：本表较初稿（2028 8-15×）显著上修，主因初稿低估了"渗透率 × 单用户强度"的乘法效应，并把多模态当成附加而非乘数。摆动最大的单一变量是普通用户渗透率，其次是多模态乘数（可在 5×~50× 间浮动），故给出 20-50× 的宽区间而非点估计。

但潜在 Token 量 ≠ 落地算力需求。 落地量受供给封顶：

2028 服务能力 = 算力(capex/硬件，受电力/HBM 物理封顶) × 效率(tokens/FLOP)
            ≈ 2.5×（capex/服务器，电力与 HBM 是硬约束）× ~10×（FP4/MoE/投机解码/Rubin 推理吞吐）
            ≈ 25×
2028 潜在需求 ≈ 20~50×（含普通用户 Agent 渗透）

若潜在落在 ~25× → 紧平衡（效率刚好接住）；
若潜在落在 ~50× → 明确短缺，缺口靠涨价/限速压平。

真正的题眼因此从"能不能造够芯片"转为"效率能否在两年内做到 ~10× 去接住消费端 Agent 爆发"。 而多模态视频生成与长程推理是全新重负载，效率曲线几乎从零起步，拉低混合效率——这恰是高情景里最吃算力、效率红利最少的部分。

推断结论：普通用户 Agent 渗透率的跃升使 2028 潜在需求上修至 ~20-50×，明显高于供给×效率的服务能力（~25×），结构性短缺的概率因此更高、而非更低。与 CSP capex 轨迹一致（四大 CSP 2026Q1 合计 capex 已超 $6300 亿；GS 年度 AI 基建 capex 2026 $7650亿→2031 $1.636万亿）。

2.4 外部二次源交叉验证（evidence 补强）

为校验上述自建模型，补充库外高/中权重实证与一手来源（2025-2026），对需求侧框架做交叉验证（注：各源单位不同——token 量 / 算力单位 / 单位成本——不可直接相加，仅作方向与量级印证）：

验证点	本报告口径	外部源	外部数据	一致性
当前消耗"编程主导"	编程是最大单一品类	OpenRouter / a16z《State of AI 2025》	编程/创意为 token 第一大驱动；编程占比从 2025 初 11% 升至 >50%	✅ 一致
Agent 驱动 token 暴涨	渗透×强度乘法跳变	OpenRouter / Nvidia	Agentic 为增长最快行为、agents 已占多数输出 token；agentic 系统较传统应用多耗 15× token、推理 token 较单次推理多耗 100× 算力	✅ 强一致
Token 量基准 ~4×/年	高情景 2027 ~5-8×	OpenRouter 实测	吞吐 ~4× YoY（2025-04 周 5T → 2026-04 周 >20T）；全市场 ~1.5 quadrillion/月	✅ 一致（本报告基准略偏保守）
效率 60-70%/年	服务能力 ~10×/2年	Barclays	推理单位成本/百万 token 18 个月降 ~90%（≈ −60%/年）	✅ 一致
潜在需求 >> 可建供给	2028 潜在 20-50× vs 供给 2.5×	Barclays	GPU/ASIC 需求 2025 超共识 250%、2027 达当前 14×；capex 超共识 $225B+(CY27/28)	✅ 强支持

校准结论：外部实证与投行口径全方向印证框架，且多处显示本报告偏保守——

1. 结构性短缺获独立背书：Barclays 的"latent 算力需求 2027 即 14×"与本报告"可建供给 ~2.5×（受电力/HBM 封顶）"并置，二者之差正是短缺缺口，独立佐证核心结论。 2. 效率降幅实证吻合：Barclays 单位成本 −90%/18 月 ≈ 本报告 −60%/年。 3. 高盛 24× 可能偏保守：OpenRouter 全市场当前 ~1.5 quadrillion/月，对照高盛 2030 年 120 quadrillion/月目标隐含 ~80×（口径差异），对本报告 20-50× 构成上行而非下行支撑。

需求侧证据链由"高盛单源"升级为 高盛 + Barclays + OpenRouter 实证 + Nvidia 多源交叉。

三、综合判断：供应能否解决

3.1 供需缺口的本质：潜在 vs 落地，效率是总开关

必须区分两个不同的量——二者之差即短缺：

潜在需求（latent）：不受限时用户想消费的 Token。高情景下（含普通用户 Agent 渗透率 5%→40%）2028 约 20-50×（见 2.3 节自下而上分解）。
落地需求（realized）= 服务能力：供给配给后实际算出的 Token，受物理产能封顶。

三条斜率叠起来：

供给侧（capex/硬件）   : 2026→2028 约 2.5×（GS 年度 capex 5 年 ~2.1×；机架级服务器 ~2.5×）——受电力/HBM 物理封顶
效率（tokens/FLOP）   : 2026→2028 约 ~10×（单 token 成本 60-70%/年降；FP4/MoE/投机解码/Rubin 推理吞吐）
服务能力 = 供给×效率  : 2026→2028 约 25×
潜在需求（高情景）     : 2026→2028 约 20-50×

关键洞察：服务能力的 ~25× 里，效率（~10×）贡献远大于 capex（~2.5×）——因为 capex 被电力和 HBM 死死压住，弹性最低。所以 2028 松紧的总开关是效率能否兑现 ~10×，而非芯片造多少。 若潜在需求落在 ~25× 是紧平衡，落在 ~50× 即明确短缺；且多模态/长程推理这类新负载效率从零起步，最可能让混合效率不及 10×、把天平推向短缺。

两者无法在 2027-2028 自然出清，缺口靠三个阀门压平：

1. 价格配给：算力租赁从"卖卡"转向"token 分成"；国内已现 token 涨价/限购线索（🔴 低，待验证）。 2. 能力配给：模型厂因算力受限主动降低 Claude 智能密度，若算力充足不受限收入会显著更高。（来源：Gavin Baker 访谈整理 | 🟡 中）这是"需求被供给压制"的直接证据。 3. 效率进步（核心释放阀）：60-70%/年的单位成本下降，是把无限需求装进有限供给的核心机制。

3.2 技术趋势如何缓解供给（题眼）

产业用五条技术路线对冲物理约束：

技术趋势	缓解环节	库内证据	权重
华为τ定律 / 3D LogicFolding / 先进封装	不靠 EUV 提升等效算力密度；投资重心光刻→封装/互联/存储	Kirin 2026 固定节点下密度 155→238 MTr/mm²（+53.5%）、能效 +41%；先进逻辑 capex 天花板 1000亿→2000亿+	🟢/🟡
ASIC / 推理专用芯片	降低单位推理成本、分流 GPU	TPU 8i 推理成本降 40-50%；AWS 自研芯片单位成本可达商业 GPU 的 1/10-1/5	🟡 中
近存计算 / 非 HBM 路线	绕开 HBM 瓶颈（推理场景）	高通/字节用近存计算+定制 LPDDR 避开 HBM，对标 TPU 性能 70%/成本 50%	🟡 中
800VDC / 液冷 / 表后供电	缓解电力与散热	800VDC 端到端效率 82%→87.4%，1GW 负载省 ~69MW；SST 2030 TAM ~$130亿	🟢 高
CPO / 硅光 / 分层存储	缓解互联带宽与存储墙	Hi-ONE 光引擎 8Tb/s；NAND 进入推理（KV cache/chat history）做分层	🟡 中

τ定律的产业含义：当几何缩放（光刻）逼近物理与地缘双重天花板，产业的"下一块钱跟着 τ 走、不跟着 node 走"——用封装/互联/存储换时间。2027-2028 算力供给的边际增量越来越多来自系统级集成效率。对中国尤为关键：在无 EUV 约束下 τ 路线提供可持续 narrow the gap 的路径（Bernstein 提醒：不会立即 close the gap，热约束与良率是 adoption 障碍）。

3.3 最终裁断

2027 年：供给能见度高（产能/HBM/封装已锁定到 2028），需求以编程+早期 Agent 为主仍可外推。紧平衡，靠涨价+效率维持，不出现崩溃式短缺，但好卡持续供不应求。
2028 年：若"多模态 C 端化 + 个人 Agent 全民化"假设兑现，潜在需求系统性超过供给扩张。供给侧无法在硬约束（电力 4-5 年提前期、HBM 4-5 年短缺）内全额满足，必以价格/能力配给+效率进步压平。结构性短缺概率高，表现为"算力很贵、能力被限速、效率被逼着狂奔"，而非"无卡可用"。
真正决定 2028 年松紧的不是芯片，是电力和 HBM。 芯片可加速造，电网与 HBM 原厂的产能弹性最低。

四、受益环节映射（按瓶颈紧张度分层）

把核心结论（硬约束电力>HBM>CoWoS>制程 + 效率是总开关）映射到利润池与库内标的。利润池迁移判断：在"效率是总开关"框架下，价值从"单芯片制程"向"系统级集成（封装/互联/存储/电力）"再分配，与 τ定律"下一块钱跟着 τ 走"一致——最稀缺利润池在电力与 HBM（供应弹性最低），最确定成长在先进封装与光互联（需求确定+国产替代双驱动）。

瓶颈层级	利润池逻辑	受益环节	库内标的（权重见各页）
①电力（最紧）	提前期最长、议价权最强、最稀缺	燃气轮机/电网/变压器/SOFC/800VDC	GEV（在手1630亿）、VRT、BE（SOFC）；新雷能（800V，🔴低）
②HBM/存储	原厂纪律+长约锁价，周期品→合同资产	HBM/DRAM/NAND/eSSD	MU、SK海力士、三星、STX、Kioxia(UBS)；国产兆易创新、长鑫(IPO)
③先进封装 CoWoS	2027供不应求、设备交期18个月	2.5D/3D封装/混合键合/TSV	长电科技、盛合晶微(未上市)、通富；设备拓荆科技（键合）、中微公司（TSV）、北方华创
④晶圆制程（最松）	产能在扩，alpha 在国产替代	代工/WFE	TSM、中芯国际；设备 KLAC/AMAT/北方华创
效率总开关	决定服务能力能否接住需求	ASIC/光互联/CPO/液冷	AVGO/GOOGL(ASIC/TPU)、MRVL、中际旭创/新易盛、工业富联(CPO)、胜宏科技/深南电路(PCB)
算力卡/租赁（需求承接）	终端算力变现	GPU/AI云/国产芯片	NVDA、AMD、CoreWeave、寒武纪/海光信息

五、反方情景：2028 为何可能不短缺（证伪路径）

主线判断是"2028 结构性短缺概率高"，但必须列出可能翻转结论的反方路径：

1. 效率超预期接住需求（最强反方）：若 FP4/MoE/蒸馏/投机解码 + Rubin 推理吞吐使 tokens/FLOP 两年做到 >10×（而非 ≤10×），服务能力可逼近甚至超过潜在需求上沿，转为紧平衡。Rubin 推理吞吐较 Blackwell 宣称提升 35×是潜在上行（🟡 中，宣称值，实测待验证）。 2. 需求假设证伪：多模态 C 端生成渗透慢于预期、个人 Agent 留存/付费不及预期、高盛 24× 本身过乐观——则潜在需求回落到 ~5-10×，供给转宽松（关联 AI应用 页 TODO-20260507-AI应用-08）。 3. AI capex 消化/泡沫：MS 表外承诺 1.3 万亿、Meta 租赁+采购约未来经营现金流 1.7 倍/Oracle 超 7 倍——若收入确认持续落后估值，capex 增速可能下修，需求侧自我修正。 4. 大摩"科技通胀"路径：2H26 晶圆/封测/存储成本飙升传导至终端涨价，PC/手机需求破坏，消费电子端芯片/存储需求回落，间接释放产能。 5. ASIC+近存计算等效扩容：推理 ASIC（TPU 8i 成本 -40-50%）+近存计算（高通/字节绕 HBM）大幅降低单位推理算力成本，等效把有限晶圆/HBM 摊出更多推理算力。

反方权重判断：路径 1（效率）与路径 2（需求证伪）是真正能翻转结论的两条；路径 3/4/5 更多是缓解而非逆转。因此本报告的短缺判断对两个变量最敏感——效率兑现度 与 普通用户 Agent 渗透的真实斜率；二者任一显著偏离，结论即需重估。

六、信源冲突提示

议题	来源A	来源B	权重
ASIC 是否"去英伟达化"	AWS/Google：自研 ASIC 加速放量、成本优势驱动替代	BofA：NVDA 2030 仍维持 65-70% 份额，ASIC 是增量非线性替代	🟡/🟢
GPU:CPU 配比	南方基金：由 1:8 → 1:1 或 1:2	全球CPU专家纪要：不认同 1:1，维持 1:4-1:8	🟡/🟡
存储周期下半年走向	Morgan Stanley：2H26"科技通胀"抑制终端需求，存储涨价或放缓	SK董事长/UBS：短缺持续 4-5 年 / NAND 涨至 2027Q3	🟡/🟢

冲突未消解，呈现分歧供判断。其中 ASIC 替代度与 GPU:CPU 配比直接影响算力卡的需求结构测算。

七、关键跟踪变量

变量	跟踪指标	频率	触发动作	反证方向
电力（最硬约束）	北美供需比、燃气轮机/变压器交期、表后供电渗透	季度	破 4:1 → 强化短缺判断	并网提速、需求放缓
HBM	HBM4/4E 量产节点、现货-合约价差、原厂扩产	季度	价差扩大 → 短缺加深	价差收敛、扩产超预期
CoWoS	国内三梯队爬坡 vs ~400万颗需求、CoW 固晶 18 月交期、台积电产能	半年	需求>产能 → 2027供不应求兑现	产能超需求、价格战
需求斜率	多模态 C 端渗透、个人 Agent 留存/付费、高盛 24× vs OpenRouter/火山实测	季度	实测>外推 → 上修潜在需求	渗透慢、付费弱（关联 TODO-20260507-AI应用-08）
效率（总开关）	tokens/FLOP 年降幅、Rubin 实测吞吐、FP4/MoE 采用率	季度	<10× → 短缺；>10× → 紧平衡	效率超预期接住需求
ASIC 份额	NVDA 加速器份额、TPU/Trainium 出货	季度	验证"去英伟达化"分歧	NVDA 维持 65-70%

信息来源

来源	权重	类型	核心贡献
Bernstein（全球 WFE / 半导体设备 / τ定律解读）	🟢 高	投行研报	WFE 2026-2028 连续上修（$148bn→$198bn）；中国 WFE 上修；τ定律"another DeepSeek moment"与三层约束
Morgan Stanley（HBM/DDR4/China AI 2.0/表外承诺）	🟢 高	投行研报	HBM 缺口 ~50%、现货-合约价背离；DDR4 缺口上修 19-20%；表外承诺 1.3 万亿；中国 AI 从训练转推理
Goldman Sachs（Agentic Token/机架级服务器/AI 基建 capex）	🟡 中高	投行研报	Token 2030 +24x、消费 Agent 12x；机架级服务器 5.5万/9万/13.6万台；2026-2031 capex ~7.6 万亿；Agent ROI 分化
Barclays（The next wave of AI / AI capex）	🟢 高	投行研报（外部补证）	GPU/ASIC 需求 2025 超共识 250%、2027 达当前 14×；推理单位成本/百万 token 18 月降 ~90%；capex 超共识 $225B+(CY27/28)
OpenRouter / a16z（State of AI 2025，100T token 实证研究）	🟢 高	实证研究（外部补证）	Token 吞吐 ~4× YoY；全市场 ~1.5 quadrillion/月；编程占比 11%→>50%；agentic 为最快增长、占多数输出 token
Nvidia（GTC / 推理技术披露）	🟡 中	厂商技术口径（外部补证）	推理 token 较单次推理多耗 100× 算力；agentic 系统多耗 15× token；Blackwell 单 token 成本降一个数量级、Rubin 延续
UBS（Kioxia initiation/NAND）	🟢 高	投行研报	NAND 价格连涨 6 季至 2027Q3；AI 推理为结构性 NAND 需求；Kioxia 成本优势
Bank of America（半导体 SOTU/HBM TAM）	🟢 高	投行研报	AI 数据中心系统 TAM 2030 ~$1.7T；HBM 2030 TAM ~$1683 亿；NVDA 2030 维持 65-70% 份额
J.P. Morgan（台积电及先进封装供应链）	🟢 高	投行研报	CoWoS 产能 11.8万→298.8万片、缺口 15-20%、客户分配；先进封装交付瓶颈框架
台积电技术论坛（新竹场）	🟡 中	现场报道	N2 量产/+45%/+70%；全球建厂年均 9 座；CoWoS 良率 98% 与光罩演进；SoIC 路线
华为官方论文（IEEE ISCAS 2026，τ定律）	🟡 中	学术论文/一手	LogicFolding 密度 +53.5%/能效 +41%；3D Folding 解决 N² vs N；投资重心从光刻转封装/互联/存储
SemiAnalysis（800VDC/AI 暗产出）	🟢 高	产业研究	800VDC 四阶段、效率 82%→87.4%、SST 2030 TAM $130亿；暗产出 ~$1.5T 替代潜力框架
GE Vernova（电力设备订单）	🟡 中	公司财报	燃气轮机交期/订单；在手订单 $1630 亿；承接 2031 年后订单
数据中心开发 CEO 专家纪要	🟡 中	专家纪要	北美供需比 3:1→4:1；表后供电主流化；单 MW capex；区域格局；国际化转向
美银（数据中心电力二次整理）	🟡 中	投行二次整理	全球数据中心用电 485TWh→950TWh；1GW capex ~$500 亿；并网等待 5-10 年
中国大陆先进封装市场深度访谈纪要	🟡 中	专家访谈	国内 CoWoS-S/L 三梯队产能；2027 供不应求；新进入门槛与设备交期 18 个月
Lumentum / 中际旭创 / AI 光互联交叉验证	🟡 中	调研+研报	1.6T 上修；EML 缺口 >30%；CPO 2028 年后规模化；铜互连短距延续
拾象投研（AGI 投资洞察）	🟡 中	一级市场研究	AI Coding 2026 ARR ~$1000 亿；ChatGPT WAU ~10亿/付费 5000万；模型商业模式向 Runtime 迁移
铠侠 / SDC StorageAI 大会（微信转述）	🟡 中	行业会议转述	AI 推理存储 CAGR 34%、占比超 50%；分层存储趋势
Gavin Baker 访谈整理	🟡 中	访谈整理	模型厂因算力受限降低智能密度（能力配给的直接证据）
自媒体/社群转述管理层（SK董事长/三星/token涨价限购）	🔴 低	自媒体转述	仅作线索参考：短缺 4-5 年、27 缺口 >26、国内 token 涨价限购，需回源官方 IR