Agent爆发背景下的Token产业链分析

本报告主要基于 Morgan Stanley、SemiAnalysis、工信部、拾象、国金证券等高/中权重来源,部分 Agent 商业化判断依赖单一中权重来源,已在对应章节标注。


核心结论

  1. Token 消耗量阶跃增长:Agent 时代单次任务 Token 消耗达 80,000–150,000,较 Chatbot 时代增长 40–75 倍,推理算力需求进入结构性扩张期。
  2. 算力租赁进入卖方市场:H100 一年期租赁价格从 2025 年 10 月低点 1.70 美元/小时/GPU 升至 2026 年 3 月约 2.35 美元/小时/GPU,涨幅近 40%,且 2026 年 8–9 月前新增产能已被预订。
  3. 价值公式重构:Agent 时代估值坐标从 DAU × ARPUToken 消耗 × 任务单价 迁移,SaaS 定价从 seat-based 转向 outcome-based。
  4. 受益面从 GPU 向系统级扩散:Morgan Stanley 估算 Agentic AI 将带来 2030 年增量 CPU TAM 325–600 亿美元,晶圆代工、ABF 载板、BMC、互联、存储等全链条受益。
  5. 涨价周期判断:当前涨价不是短期波动,更可能是持续 1–2 年 的周期,核心变量是 GB300 供给释放节奏与 B 端 Agent 落地时点(预计 Q3)。

一、需求端:Agent 驱动 Token 消耗量阶跃式增长

1.1 消耗量级跃升

Agent 执行任务的机制决定了 Token 消耗量较传统 Chatbot 发生数量级跃迁:

时代 单次任务 Token 消耗 倍数变化
Chatbot 时代 500–2,000 基准
Agent 时代 80,000–150,000 40–75 倍增长

三大驱动机制:

(来源:SemiAnalysis / 云算力涨价潮分析 | 权重:中)

1.2 实际数据验证

指标 数值 时间
中国全国每日 Token 消耗 140 万亿 工信部官方数据
字节跳动每日 Token 消耗 100 万亿 2026-03,较 2025-12 的 63 万亿增长近 60%
Anthropic ARR 超 250 亿美元 单季度从 90 亿美元增长近 3 倍
全年算力需求判断 30–50% 增长

(来源:算力租赁概念词条综合整理 | 权重:中)

1.3 商业模式重构:从 DAU 到 Token 经济学

拾象判断,Agent 正在推动软件范式和估值逻辑的根本性迁移:

维度 旧范式(互联网时代) 新范式(Agent 时代)
价值公式 价值 = DAU × ARPU 价值 = Token 消耗 × 任务单价
定价模式 按 seat 定价 按 outcome 定价
买方身份 "信息系统"采购者 "劳动力"雇主

典型案例:Claude Code 用户规模约 ChatGPT 的 1/20,但两者 ARR 当下已基本持平。在互联网时代,5% 用户量跑出可比收入是不成立的。

⚠️ 以上商业模式判断主要来自拾象 AGI 备忘录(中权重),属范式观察,尚未经多个独立高权重来源交叉验证。

(来源:拾象 AGI 备忘录 / AI 智能体概念词条 | 权重:中)


二、供给端:算力租赁进入"卖方市场"

2.1 GPU 租赁价格持续上涨

H100 一年期租赁价格指数(SemiAnalysis)

时间点 价格(美元/小时/GPU) 变化
2025 年 10 月 1.70 阶段低点
2026 年 1 月下旬 突破 2.00 首次突破
2026 年 2 月下旬 较 1 月底再涨 15%–20% 加速上涨
2026 年 3 月 2.35 较低点涨幅近 40%
当前区间 2.00–2.70 中位数 2.35

中国市场同步涨价

产品 价格 趋势
H100 8 卡 9.7 万/月(一年期租约) 持续上涨
B300 集群(散单) 18 万/月 本周涨 10%
B300 集群(大单) ~15 万/月 预计下阶段涨 20–30%

(来源:SemiAnalysis / 国金计算机 | 权重:高/中)

2.2 供不应求的硬证据

(来源:SemiAnalysis | 权重:高)

2.3 B300 盈利模型验证

按 NCP 渠道采购价格测算,单台 B300 8 卡服务器年度收支:

项目 金额(万/年/台)
租赁收入(15 万/月) 180
折旧(5 年残值 20%) 65.54
电费(PUE 1.25) 7.14
机柜+运维 14.5
财务成本(90% 融资率,4% 利率) 14.75
税后净利润 66.36
经营性现金流 143.61

关键指标:

(来源:算力租赁盈利分析 | 权重:中)


三、产业链扩散:从 GPU 到系统级瓶颈

3.1 Agentic AI 重新定义受益面

Morgan Stanley 将 Agentic AI 定义为从"生成"走向"自主行动"的架构迁移:

这意味着 Agent 爆发不仅利好 GPU,更将算力需求的受益面从单一训练卡扩散到全数据中心基础设施

(来源:Morgan Stanley | 权重:

3.2 系统级供给瓶颈(不是缺卡,是缺整机)

Agent 带来的推理需求暴涨,叠加供应链多环节瓶颈,形成"系统级紧缺":

瓶颈环节 状态
内存 LPDDR5 合同价 2026 年 Q1 同比上涨约 4 倍,DDR5 同比上涨约 6 倍
服务器 OEM 开始按显著超过组件成本涨幅的水平重新给 AI 服务器定价
CPU AMD、英特尔 CPU 涨价,且预计不止一次
晶圆 台积电 N3 逻辑晶圆、HBM、DRAM、NAND 等多个环节存在瓶颈

(来源:SemiAnalysis / 云算力涨价潮分析 | 权重:中)

3.3 其他基建环节同步紧张

环节 当前状态
光互联 800G/1.6T 出货受 EML、隔离器、滤波器等物料约束;100G EML 从 5 美元涨至约 7 美元,200G EML 当前 20–25 美元;2026–2027 年光模块物料基本分配完毕
PCB / CCL 价格已涨 10%–40%,市场缺口超 20%;AI 服务器 PCB 层数升级叠加电子布供给瓶颈
存储 DRAM/NAND 合约价继续上修;B200 GPU 租赁月涨 23.5% 至 5.47 美元/时;DDR5 现货首跌,提示"数据中心合约价强、消费级现货弱"的结构分化
液冷 / 电力 AI 服务器功耗上升带动 CDU、冷却液和数据中心供电需求;变压器、燃气轮机和并网瓶颈持续

(来源:2026-04-21 日报 / 各产业链图谱页综合 | 权重:中高混合)


四、产业链价值分配与市场格局

4.1 定价权归属转移

阶段 特征
2025 年末之前 GPU 租赁定价更有竞争性,运营商关心利用率
现在 Neocloud 和超大规模云服务商拿到更强谈判权——更高预付款、更好价格、更长合同期限、可匹配库存节奏的合同起止时间

AI 原生公司越来越愿意签更长合同,甚至接受高于 20% 的预付款。

(来源:SemiAnalysis / 国金计算机 | 权重:中)

4.2 不同商业模式的分化

模式 代表 现状
聚合平台 硅基流动等 自持算力 <40%,轻资产模式面临利润压力,涨价难以传导
大厂自持 阿里云、字节跳动 大幅提高自持算力比例,阿里云部署自研 PPU,字节自研芯片+大量国产芯片
Neocloud CoreWeave、Nebius、IREN 股价处于 6–12 个月交易区间低端,但产业端景气度高,存在预期差
火山引擎 字节云品牌 若不跟涨是切入大 B 窗口期,长期低价不可持续

(来源:云算力涨价潮分析 / 国金计算机 | 权重:中)

4.3 中国市场特点

(来源:东吴计算机 / 国金计算机 | 权重:中)


五、关键观察变量与风险

变量 影响方向 当前状态
GB300 新增供给释放速度 ↓ 价格 Blackwell 交付周期延长至 6–7 月
台积电 N3、HBM、DRAM、NAND 紧张程度 ↑ 价格 系统级瓶颈难以短期缓解
AI 实验室 ARR、采用率和 Token 消耗增速 ↑ 需求 Anthropic ARR 近 3 倍增长
B 端 Agent 落地节奏 ↑ 需求 预计 Q3 中国落地
高价格何时压制需求 ↓ 价格 ROI 持续验证 5–10 倍,阈值不明

核心判断:GPU 租赁价格更可能继续上涨而非下跌,这轮涨价不是短期波动,而是一个持续 1–2 年的周期。

(来源:SemiAnalysis / 算力租赁概念词条 | 权重:中)


六、投资线索映射

产业链环节 A 股/美股映射方向 核心逻辑
算力租赁 CoreWeave、Nebius、IREN、宏景科技、协创数据、润建股份、海南华铁 价格进入上涨周期,NCP 渠道 B300 回本周期仅 2.85 年
光互联 中际旭创、新易盛、天孚通信、鼎通科技 800G/1.6T 需求爆发,EML 等物料紧缺
PCB / CCL 胜宏科技、沪电股份、台光电子 AI 服务器层数升级,电子布/CCL 涨价 10%–40%
存储 美光科技、长鑫存储(未上市) HBM4 量产启动,DRAM/NAND 合约价上修
先进封装 日月光投控、长电科技 CoWoS-like 产能 2027E +165%
AI 芯片 / ASIC 博通、Marvell、芯原股份 AI ASIC 定制订单爆发,芯原 1–4 月 AI 算力订单占比 >85%
半导体设备 ASML、北方华创 Memory 销售首超 Logic,DUV 利润杠杆被低估

信息来源

日期 来源文件 核心内容 信源权重
2026-04-03 GPU租赁价格继续上涨,市场在交易更长的短缺 SemiAnalysis H100 一年期租赁价格指数、系统级供给瓶颈、合同期限结构 🟢 高(SemiAnalysis)
2026-04-03 云算力涨价潮:当GPU从贬值预期走向供不应求 Agent AI 对 Token 消耗重构(40–75 倍)、涨价逻辑、市场格局重塑 🟡 中
2026-04-12 算力租赁洞察:现在B300的盈利能力如何... B300 盈利模型、价格动态、重点标的 🟡 中
2026-04-14 周末大摩怎么看国内AI行业 国内云厂商、模型公司和 AI 应用需求动态 🟢 高(Morgan Stanley)
2026-04-18 拾象 AGI 备忘录 #1:Coding is eating SaaS, and the white-collar is next Agent 架构演进、软件范式变迁、价值公式重构 🟡 中
2026-04-19 wiki/02-概念词条/算力租赁.md 算力租赁价格、盈利模型、需求驱动综合整理 🟡 中
2026-04-20 wiki/03-产业链图谱/AI应用.md Token 消耗、Agent 产品形态、商业化线索 🟡 中
2026-04-21 wiki/06-日报/【2026-04-21】投资逻辑更新.md Morgan Stanley Agentic AI CPU TAM 与供应链扩散逻辑 🟢 高(Morgan Stanley)

⚠️ 本报告中部分结论(如 Token 消耗 40–75 倍增长、B300 盈利模型、Agent 商业模式重构)仅有中权重来源支撑,建议等待更多高权重数据验证后更新核心 Claim。