经典论文与方法
本目录整理 AI Agent 领域中最常被引用、也最容易被误用的经典论文和早期开源实践。
阅读目标不是背论文标题,而是判断:
- 它解决哪类 Agent 能力问题。
- 它的证据来自什么实验或实践环境。
- 它对现代工程系统有什么可借鉴结构。
- 它有哪些不能照搬到生产的边界。
1. 阅读路径
| 顺序 | 文件 | 关注问题 | 读完应能判断 |
|---|---|---|---|
| 1 | ReAct | 推理、行动和观察如何组成 Agent Loop | 什么时候需要多步工具循环,如何记录 trace |
| 2 | Toolformer | 模型如何学习工具调用模式 | 工具调用为什么需要数据和评测 |
| 3 | Tree of Thoughts | 如何搜索多个候选推理状态 | 什么时候值得用搜索式规划 |
| 4 | Reflexion | 失败反馈如何变成下一轮经验 | 反思依赖什么评估器,如何避免错误记忆 |
| 5 | Generative Agents | 长期记忆如何影响行为 | 记忆流、反思和计划如何组合 |
| 6 | Voyager | 技能如何在开放环境中积累 | 技能库如何验证、入库和复用 |
| 7 | AutoGPT 与 BabyAGI | 早期开源自主循环暴露了什么问题 | 为什么“全自主”必须先受权限、预算和终止条件约束 |
| 8 | Agent 论文脉络 | 按能力维度串联所有资料 | 如何按工具、规划、记忆、反思、多 Agent、评测、安全选方法 |
2. 能力地图
3. 阅读提醒
- 论文实验通常发生在受控任务、受控工具和特定模型设置中。
- 论文中的方法结构可以借鉴,但生产系统必须补齐权限、审计、评测、成本和安全。
- AutoGPT 和 BabyAGI 是早期开源实践,不是严格论文证据。
- 所有“最新平台能力”和“当前 SDK 用法”要回到
../99-权威资料索引/官方文档索引.md核对。
4. 推荐使用方式
学习时:
- 先读每篇的“背景问题”和“方法结构”。
- 再看“实验设置与证据边界”。
- 最后重点看“今天工程系统如何借鉴”和“不能直接照搬的地方”。
做技术路线判断时:
- 工具调用不准,先看 ReAct 和 Toolformer。
- 规划容易走偏,先看 Tree of Thoughts 和 AutoGPT/BabyAGI。
- 重复犯错,先看 Reflexion。
- 长期上下文混乱,先看 Generative Agents。
- 想沉淀可复用技能,先看 Voyager。
5. 权威资料
- 论文索引:../99-权威资料索引/论文索引.md
- 官方文档索引:../99-权威资料索引/官方文档索引.md
- 开源项目索引:../99-权威资料索引/开源项目索引.md
- 安全资料索引:../99-权威资料索引/安全资料索引.md
- 核对日期:2026-05-09