AI智能体
AI智能体
Agent 自我进化与 AI 智能体应用范式的同花顺概念归并页
迁移说明
- 同花顺概念:AI智能体(309183)
- 合并来源:
Agent自我进化.md - 迁移日期:2026-04-19
合并内容
原页面:Agent自我进化
Agent 自我进化与软件范式变迁
一句话定义:Agent 能力的提升不仅来自模型权重迭代,更来自 Harness(执行环境)、Multi-Agent 协作与 Planning 架构的系统演进;这一演进正在推动 "Coding is eating SaaS" 的软件范式革命,从"工具辅助"走向"代理执行"。
核心框架:三层进化
Model 层:最传统,但最重
- 定义:底层模型本身,也就是权重
- 方法:SFT、RL、LoRA 等更新权重
- 问题:catastrophic forgetting(灾难性遗忘)
- 成本:最高,依赖训练数据、基础设施、评测闭环
- 判断:更像平台级能力,不是普通产品团队可频繁迭代的日常手段
Harness 层:近一年最被低估的增益点
- 定义:驱动模型运行的"外壳"——系统提示词、工具暴露、调用循环、上下文截断、重试机制等;更直白的说法是给 agent 搭一套"上班需要的 Infra"
- 关键洞察:agent 的进化可以不改模型,只改运行框架
- Meta-Harness 工作:
- 让 agent 在一批任务上运行
- 收集完整执行日志与得分
- 让 coding agent 阅读这些材料,提出 harness 改动
- 评测新 harness,继续迭代
- 结果:强调"文件系统级上下文"能把每轮优化可用诊断信息提升到远高于传统做法的量级
- 拾象判断:真正把 Harness 做到生产级的,大概率还是围绕 Claude、OpenAI 等离模型更近的团队,因为他们必须随着模型进步持续迭代 Harness,才能既 harness 住模型又不被模型能力反向吞没
Context 层:离业务最近,最适合先落地
- 定义:位于 harness 之外、用来配置 agent 的内容
- instructions、skills、tools、memory files、用户偏好、团队规则
- 关键:不在"模型学到了什么",而在"系统记住了什么,并在之后的会话中如何继续使用"
- LangChain Deep Agents 支持:
- agent-scoped memory(所有用户共享)
- user-scoped memory(每个用户独立)
- 在线更新 + 后台整理
- skills 作为程序性记忆,按需加载
Agent 架构演进:从单 Agent 到 Multi-Agent
单 Agent 与 Harness 提升
- Claude Code:代表当前最强的单 Agent 编程体验;拾象观察显示,过去 1-2 个月硅谷 AI 工程师亲手写代码的比例从 70-80% 降到 5% 以下,很多工程师直接承认 Claude Code 比自己强
- Harness 的持续优化:Claude Code 的 Harness 本身在快速提升,为 agent 搭建的工作环境越来越适合它自己发挥;one-shot prompt 基本能完成任务的突破,既来自模型(Claude Opus 4.5/4.7),也来自 Harness
Multi-Agent:并行计算与组织鲁棒性
- 本质:在单位时间内做足够多的并行计算,通过并行和交叉分工的方式组织起来,让系统的鲁棒性更强
- 拾象判断:这不是算法问题,更多是管理学问题——像大厂赛马
- 硬件驱动:进入 Agent 时代,尤其在 multi-agent 背景下,需要 "AI-native hardware",对硬件同时提出三个维度要求:
- Context 处理能力:需要把 context 拆到多个 agent 上以避免长上下文的 decay
- 单次推理速度:需再推高 5-10 倍;速度不够,思考就不够全面,必须引入多个并行 agent
- 合作过程数据 throughput:任务分配到不同 agent、再汇总到下一环节,数据传输量要求极高
Planning Agent:Multi-Agent 中最值钱的角色
- 核心判断:Multi-Agent 里真正值钱的不是 execution agent,而是 planning agent——定角色、开 agent、派任务的那个核心角色
- 结构性的定价能力:高价值任务的"二八结构"在当下成立,依赖于顶尖模型在 planner 位置上始终拉得开差距;一旦平价模型跨过"够用阈值",顶尖模型在该场景就会被重新定价为平价模型,从"80% spending 区"滑向"80% token 区"
软件范式变迁:Coding is eating SaaS
从"Copilot 提效"到"Agent 替代"
| 阶段 | 时间 | 特征 | 代码生成比例 |
|---|---|---|---|
| Copilot 提效 | 2024-2025 | 5%-20% 的辅助提效 | <20% |
| Agent 主导 | 2026Q1-Q2 | 80%+ 代码由 agent 完成 | 80%+ |
| 全面替代 | 2026 下半年- | 工程师只做 review,甚至不打开编辑器 | 趋近 100% |
- 冲击层级:
- 第一层:白领被替代,seat-based 需求收缩
- 第二层:企业软件的毛利被重估——当每个员工都能在公司内部"搓"一套 CRM、一套简单审批流时,软件本来就不应该付那么多钱
价值公式与定价逻辑重构
- 旧公式(互联网时代):
价值 = DAU × ARPU - 新公式(Agent 时代):
价值 = Token 消耗 × 任务单价 - 定价模式迁移:SaaS 时代按 seat 定价 → Agent 时代按 outcome 定价
- 买方身份变化:从"信息系统"的采购者 → "劳动力"的雇主
ToC / ToB 边界消融
- 传统二分法是"互联网时代的旧地图"
- 案例:Claude Code 用户规模约 ChatGPT 的 1/20,但两者 ARR 当下已基本持平,甚至有反超趋势;在互联网时代,5% 用户量跑出可比收入是不成立的
- 新评估维度:不再看 ToC 还是 ToB,而是看它承载的是不是高价值任务、它分到的是 80% 的 token 还是 80% 的 spending
高价值任务的定义
- GTC 2026 Jensen Huang 定义:由 agent 独立完成、长周期、吐出大量 token 最终交付结果的任务
- 共同特征:高智力从业门槛、单位智能消耗高、单位产出价值也高(法律、金融、Coding 等)
- 硬件映射:NVDA 将模型使用场景分为四档,每档平均分配 25% 的卡;最高价值 25% 场景虽只用 1/4 的卡,却可能为客户创造 80% 的收入
三层对比
| 维度 | Model | Harness | Context |
|---|---|---|---|
| 学习频率 | 低频 | 中频 | 高频 |
| 成本 | 最高 | 中等 | 最低 |
| 驱动方 | 平台级 | 工程驱动 | 业务驱动 |
| 落地难度 | 最难 | 中等 | 最容易 |
| 先落地顺序 | 最后 | 第二阶段 | 最先 |
产品映射
Claude Code
- Model:Claude Sonnet 等模型
- Harness:Claude Code 本身
- User context:CLAUDE.md、/skills、mcp.json
OpenClaw
- Model:可以接多个模型
- Harness:Pi 加上运行脚手架
- Agent context:SOUL.md 与来自 ClawHub 的技能
团队落地四阶段
- 先把 traces 做对:统一记录任务输入、工具调用、关键中间状态、输出结果、人工反馈
- 优先做 Context learning:从用户偏好、团队规则、术语表、操作 SOP 开始
- 建立 Harness optimization loop:对 harness 版本做 A/B 对照和自动评测
- 最后才考虑 Model-level learning:只有积累了足够多高质量 traces 后再进入微调
核心结论
未来更强的 agent,不一定先来自更大的模型,而更可能先来自更会「复盘、记忆、重构」的系统。
拾象补充:Coding 的泛化方式大概率就是下一批白领任务的泛化方式。 当 execution 都被 AI 吃掉之后,人的价值将聚焦于那 10% 的"超级杠杆"工作。
本次摄取变更
来源:拾象 AGI 备忘录 #1:Coding is eating SaaS, and the white-collar is next(2026-04-18)
| 变更类型 | 内容 | 严重程度 |
|---|---|---|
| 新增章节 | Agent 架构演进:单 Agent → Multi-Agent → Planning Agent 的完整分析 | normal |
| 新增章节 | 软件范式变迁:Coding eating SaaS、价值公式变化、定价模式迁移、高价值任务定义 | normal |
| 扩展内容 | Harness 层补充拾象观点(生产级 Harness 由谁定义、Harness 与模型的博弈关系) | normal |
| 扩展内容 | 产品映射中 OpenClaw 补充定位与拾象判断 | normal |
| 标题更新 | 从 "Agent 自我进化(DeerFlow 三层框架)" 扩展为 "Agent 自我进化与软件范式变迁" | normal |
信息来源
| 日期 | 来源文件 | 核心内容 | 信源权重 |
|---|---|---|---|
| 2026-04-17 | 字节最火的开源Agent项目,如何思考Agent的自我进化?.md |
DeerFlow 框架、三层进化、团队落地路径 | 🟡 medium |
| 2026-04-18 | 拾象 AGI 备忘录 #1:Coding is eating SaaS, and the white-collar is next.md |
Agent 架构演进(Harness/Multi-Agent/Planning)、软件范式变迁、Labs 战略与商业化数据 | 🟡 medium |
[2026-04-18] lint | 补充交叉引用,新增 2 个 outgoing link(英伟达)
本页面由 LLM 基于原始剪报自动整理生成,最后更新:2026-04-18