Agent爆发背景下的Token产业链分析
Agent爆发背景下的Token产业链分析
本报告主要基于 Morgan Stanley、SemiAnalysis、工信部、拾象、国金证券等高/中权重来源,部分 Agent 商业化判断依赖单一中权重来源,已在对应章节标注。
核心结论
- Token 消耗量阶跃增长:Agent 时代单次任务 Token 消耗达 80,000–150,000,较 Chatbot 时代增长 40–75 倍,推理算力需求进入结构性扩张期。
- 算力租赁进入卖方市场:H100 一年期租赁价格从 2025 年 10 月低点 1.70 美元/小时/GPU 升至 2026 年 3 月约 2.35 美元/小时/GPU,涨幅近 40%,且 2026 年 8–9 月前新增产能已被预订。
- 价值公式重构:Agent 时代估值坐标从
DAU × ARPU向Token 消耗 × 任务单价迁移,SaaS 定价从 seat-based 转向 outcome-based。 - 受益面从 GPU 向系统级扩散:Morgan Stanley 估算 Agentic AI 将带来 2030 年增量 CPU TAM 325–600 亿美元,晶圆代工、ABF 载板、BMC、互联、存储等全链条受益。
- 涨价周期判断:当前涨价不是短期波动,更可能是持续 1–2 年 的周期,核心变量是 GB300 供给释放节奏与 B 端 Agent 落地时点(预计 Q3)。
一、需求端:Agent 驱动 Token 消耗量阶跃式增长
1.1 消耗量级跃升
Agent 执行任务的机制决定了 Token 消耗量较传统 Chatbot 发生数量级跃迁:
| 时代 | 单次任务 Token 消耗 | 倍数变化 |
|---|---|---|
| Chatbot 时代 | 500–2,000 | 基准 |
| Agent 时代 | 80,000–150,000 | 40–75 倍增长 |
三大驱动机制:
- 多轮推理循环:"推理→行动→反思"的循环链条反复调用大模型
- 长上下文记忆:每次请求需发送完整上下文和历史记录
- 多模态内容爆炸:单次截图消耗 4,000–5,000 tokens,简单任务可能涉及数十次截图
(来源:SemiAnalysis / 云算力涨价潮分析 | 权重:中)
1.2 实际数据验证
| 指标 | 数值 | 时间 |
|---|---|---|
| 中国全国每日 Token 消耗 | 140 万亿 | 工信部官方数据 |
| 字节跳动每日 Token 消耗 | 100 万亿 | 2026-03,较 2025-12 的 63 万亿增长近 60% |
| Anthropic ARR | 超 250 亿美元 | 单季度从 90 亿美元增长近 3 倍 |
| 全年算力需求判断 | 30–50% 增长 | — |
(来源:算力租赁概念词条综合整理 | 权重:中)
1.3 商业模式重构:从 DAU 到 Token 经济学
拾象判断,Agent 正在推动软件范式和估值逻辑的根本性迁移:
| 维度 | 旧范式(互联网时代) | 新范式(Agent 时代) |
|---|---|---|
| 价值公式 | 价值 = DAU × ARPU |
价值 = Token 消耗 × 任务单价 |
| 定价模式 | 按 seat 定价 | 按 outcome 定价 |
| 买方身份 | "信息系统"采购者 | "劳动力"雇主 |
典型案例:Claude Code 用户规模约 ChatGPT 的 1/20,但两者 ARR 当下已基本持平。在互联网时代,5% 用户量跑出可比收入是不成立的。
⚠️ 以上商业模式判断主要来自拾象 AGI 备忘录(中权重),属范式观察,尚未经多个独立高权重来源交叉验证。
(来源:拾象 AGI 备忘录 / AI 智能体概念词条 | 权重:中)
二、供给端:算力租赁进入"卖方市场"
2.1 GPU 租赁价格持续上涨
H100 一年期租赁价格指数(SemiAnalysis):
| 时间点 | 价格(美元/小时/GPU) | 变化 |
|---|---|---|
| 2025 年 10 月 | 1.70 | 阶段低点 |
| 2026 年 1 月下旬 | 突破 2.00 | 首次突破 |
| 2026 年 2 月下旬 | 较 1 月底再涨 15%–20% | 加速上涨 |
| 2026 年 3 月 | 2.35 | 较低点涨幅近 40% |
| 当前区间 | 2.00–2.70 | 中位数 2.35 |
中国市场同步涨价:
| 产品 | 价格 | 趋势 |
|---|---|---|
| H100 8 卡 | 9.7 万/月(一年期租约) | 持续上涨 |
| B300 集群(散单) | 18 万/月 | 本周涨 10% |
| B300 集群(大单) | ~15 万/月 | 预计下阶段涨 20–30% |
(来源:SemiAnalysis / 国金计算机 | 权重:高/中)
2.2 供不应求的硬证据
- 按需租赁容量:几乎完全售罄,锁定按需实例的客户不愿释放产能回资源池
- 新产能预订:2026 年 8–9 月前上线的所有新增产能已被预订
- 合同续约:H100 正以 2–3 年前签约时的相同价格续约,部分合同续约至 2028 年(为期 4 年)
- 转租现象:算力租户像摩纳哥大奖赛期间的公寓一样细分集群并转租算力
(来源:SemiAnalysis | 权重:高)
2.3 B300 盈利模型验证
按 NCP 渠道采购价格测算,单台 B300 8 卡服务器年度收支:
| 项目 | 金额(万/年/台) |
|---|---|
| 租赁收入(15 万/月) | 180 |
| 折旧(5 年残值 20%) | 65.54 |
| 电费(PUE 1.25) | 7.14 |
| 机柜+运维 | 14.5 |
| 财务成本(90% 融资率,4% 利率) | 14.75 |
| 税后净利润 | 66.36 |
| 经营性现金流 | 143.61 |
关键指标:
- 现金流回本周期:2.85 年
- 每 1000 卡 B300 年利润:6.64 亿
- 20x PE 对应市值增厚:260 亿(每 1000 卡)
(来源:算力租赁盈利分析 | 权重:中)
三、产业链扩散:从 GPU 到系统级瓶颈
3.1 Agentic AI 重新定义受益面
Morgan Stanley 将 Agentic AI 定义为从"生成"走向"自主行动"的架构迁移:
- CPU 角色升级:负责工具调用、状态管理、长上下文和多步骤编排
- 增量 CPU TAM(至 2030 年):325–600 亿美元
- 新增受益环节:晶圆代工、ABF 载板、BMC、互联、设备和部分存储
这意味着 Agent 爆发不仅利好 GPU,更将算力需求的受益面从单一训练卡扩散到全数据中心基础设施。
(来源:Morgan Stanley | 权重:高)
3.2 系统级供给瓶颈(不是缺卡,是缺整机)
Agent 带来的推理需求暴涨,叠加供应链多环节瓶颈,形成"系统级紧缺":
| 瓶颈环节 | 状态 |
|---|---|
| 内存 | LPDDR5 合同价 2026 年 Q1 同比上涨约 4 倍,DDR5 同比上涨约 6 倍 |
| 服务器 | OEM 开始按显著超过组件成本涨幅的水平重新给 AI 服务器定价 |
| CPU | AMD、英特尔 CPU 涨价,且预计不止一次 |
| 晶圆 | 台积电 N3 逻辑晶圆、HBM、DRAM、NAND 等多个环节存在瓶颈 |
(来源:SemiAnalysis / 云算力涨价潮分析 | 权重:中)
3.3 其他基建环节同步紧张
| 环节 | 当前状态 |
|---|---|
| 光互联 | 800G/1.6T 出货受 EML、隔离器、滤波器等物料约束;100G EML 从 5 美元涨至约 7 美元,200G EML 当前 20–25 美元;2026–2027 年光模块物料基本分配完毕 |
| PCB / CCL | 价格已涨 10%–40%,市场缺口超 20%;AI 服务器 PCB 层数升级叠加电子布供给瓶颈 |
| 存储 | DRAM/NAND 合约价继续上修;B200 GPU 租赁月涨 23.5% 至 5.47 美元/时;DDR5 现货首跌,提示"数据中心合约价强、消费级现货弱"的结构分化 |
| 液冷 / 电力 | AI 服务器功耗上升带动 CDU、冷却液和数据中心供电需求;变压器、燃气轮机和并网瓶颈持续 |
(来源:2026-04-21 日报 / 各产业链图谱页综合 | 权重:中高混合)
四、产业链价值分配与市场格局
4.1 定价权归属转移
| 阶段 | 特征 |
|---|---|
| 2025 年末之前 | GPU 租赁定价更有竞争性,运营商关心利用率 |
| 现在 | Neocloud 和超大规模云服务商拿到更强谈判权——更高预付款、更好价格、更长合同期限、可匹配库存节奏的合同起止时间 |
AI 原生公司越来越愿意签更长合同,甚至接受高于 20% 的预付款。
(来源:SemiAnalysis / 国金计算机 | 权重:中)
4.2 不同商业模式的分化
| 模式 | 代表 | 现状 |
|---|---|---|
| 聚合平台 | 硅基流动等 | 自持算力 <40%,轻资产模式面临利润压力,涨价难以传导 |
| 大厂自持 | 阿里云、字节跳动 | 大幅提高自持算力比例,阿里云部署自研 PPU,字节自研芯片+大量国产芯片 |
| Neocloud | CoreWeave、Nebius、IREN | 股价处于 6–12 个月交易区间低端,但产业端景气度高,存在预期差 |
| 火山引擎 | 字节云品牌 | 若不跟涨是切入大 B 窗口期,长期低价不可持续 |
(来源:云算力涨价潮分析 / 国金计算机 | 权重:中)
4.3 中国市场特点
- 涨价目的:筛选客户而非单纯转嫁成本
- 负载结构:国内云厂商 AI 算力输出仅约 20% 对外产生收入,大部分内部使用
- B 端爆发预期:预计 Q3 左右看到较多企业级 Agent 落地
- 市场规模:2024 年中国人工智能算力市场规模 190 亿美元,2028 年预测 552 亿美元
(来源:东吴计算机 / 国金计算机 | 权重:中)
五、关键观察变量与风险
| 变量 | 影响方向 | 当前状态 |
|---|---|---|
| GB300 新增供给释放速度 | ↓ 价格 | Blackwell 交付周期延长至 6–7 月 |
| 台积电 N3、HBM、DRAM、NAND 紧张程度 | ↑ 价格 | 系统级瓶颈难以短期缓解 |
| AI 实验室 ARR、采用率和 Token 消耗增速 | ↑ 需求 | Anthropic ARR 近 3 倍增长 |
| B 端 Agent 落地节奏 | ↑ 需求 | 预计 Q3 中国落地 |
| 高价格何时压制需求 | ↓ 价格 | ROI 持续验证 5–10 倍,阈值不明 |
核心判断:GPU 租赁价格更可能继续上涨而非下跌,这轮涨价不是短期波动,而是一个持续 1–2 年的周期。
(来源:SemiAnalysis / 算力租赁概念词条 | 权重:中)
六、投资线索映射
| 产业链环节 | A 股/美股映射方向 | 核心逻辑 |
|---|---|---|
| 算力租赁 | CoreWeave、Nebius、IREN、宏景科技、协创数据、润建股份、海南华铁 | 价格进入上涨周期,NCP 渠道 B300 回本周期仅 2.85 年 |
| 光互联 | 中际旭创、新易盛、天孚通信、鼎通科技 | 800G/1.6T 需求爆发,EML 等物料紧缺 |
| PCB / CCL | 胜宏科技、沪电股份、台光电子 | AI 服务器层数升级,电子布/CCL 涨价 10%–40% |
| 存储 | 美光科技、长鑫存储(未上市) | HBM4 量产启动,DRAM/NAND 合约价上修 |
| 先进封装 | 日月光投控、长电科技 | CoWoS-like 产能 2027E +165% |
| AI 芯片 / ASIC | 博通、Marvell、芯原股份 | AI ASIC 定制订单爆发,芯原 1–4 月 AI 算力订单占比 >85% |
| 半导体设备 | ASML、北方华创 | Memory 销售首超 Logic,DUV 利润杠杆被低估 |
信息来源
| 日期 | 来源文件 | 核心内容 | 信源权重 |
|---|---|---|---|
| 2026-04-03 | GPU租赁价格继续上涨,市场在交易更长的短缺 |
SemiAnalysis H100 一年期租赁价格指数、系统级供给瓶颈、合同期限结构 | 🟢 高(SemiAnalysis) |
| 2026-04-03 | 云算力涨价潮:当GPU从贬值预期走向供不应求 |
Agent AI 对 Token 消耗重构(40–75 倍)、涨价逻辑、市场格局重塑 | 🟡 中 |
| 2026-04-12 | 算力租赁洞察:现在B300的盈利能力如何... |
B300 盈利模型、价格动态、重点标的 | 🟡 中 |
| 2026-04-14 | 周末大摩怎么看国内AI行业 |
国内云厂商、模型公司和 AI 应用需求动态 | 🟢 高(Morgan Stanley) |
| 2026-04-18 | 拾象 AGI 备忘录 #1:Coding is eating SaaS, and the white-collar is next |
Agent 架构演进、软件范式变迁、价值公式重构 | 🟡 中 |
| 2026-04-19 | wiki/02-概念词条/算力租赁.md |
算力租赁价格、盈利模型、需求驱动综合整理 | 🟡 中 |
| 2026-04-20 | wiki/03-产业链图谱/AI应用.md |
Token 消耗、Agent 产品形态、商业化线索 | 🟡 中 |
| 2026-04-21 | wiki/06-日报/【2026-04-21】投资逻辑更新.md |
Morgan Stanley Agentic AI CPU TAM 与供应链扩散逻辑 | 🟢 高(Morgan Stanley) |
⚠️ 本报告中部分结论(如 Token 消耗 40–75 倍增长、B300 盈利模型、Agent 商业模式重构)仅有中权重来源支撑,建议等待更多高权重数据验证后更新核心 Claim。