跳到主要内容

经典论文与方法

本目录整理 AI Agent 领域中最常被引用、也最容易被误用的经典论文和早期开源实践。

阅读目标不是背论文标题,而是判断:

  • 它解决哪类 Agent 能力问题。
  • 它的证据来自什么实验或实践环境。
  • 它对现代工程系统有什么可借鉴结构。
  • 它有哪些不能照搬到生产的边界。

1. 阅读路径

顺序文件关注问题读完应能判断
1ReAct推理、行动和观察如何组成 Agent Loop什么时候需要多步工具循环,如何记录 trace
2Toolformer模型如何学习工具调用模式工具调用为什么需要数据和评测
3Tree of Thoughts如何搜索多个候选推理状态什么时候值得用搜索式规划
4Reflexion失败反馈如何变成下一轮经验反思依赖什么评估器,如何避免错误记忆
5Generative Agents长期记忆如何影响行为记忆流、反思和计划如何组合
6Voyager技能如何在开放环境中积累技能库如何验证、入库和复用
7AutoGPT 与 BabyAGI早期开源自主循环暴露了什么问题为什么“全自主”必须先受权限、预算和终止条件约束
8Agent 论文脉络按能力维度串联所有资料如何按工具、规划、记忆、反思、多 Agent、评测、安全选方法

2. 能力地图

3. 阅读提醒

  • 论文实验通常发生在受控任务、受控工具和特定模型设置中。
  • 论文中的方法结构可以借鉴,但生产系统必须补齐权限、审计、评测、成本和安全。
  • AutoGPT 和 BabyAGI 是早期开源实践,不是严格论文证据。
  • 所有“最新平台能力”和“当前 SDK 用法”要回到 ../99-权威资料索引/官方文档索引.md 核对。

4. 推荐使用方式

学习时:

  • 先读每篇的“背景问题”和“方法结构”。
  • 再看“实验设置与证据边界”。
  • 最后重点看“今天工程系统如何借鉴”和“不能直接照搬的地方”。

做技术路线判断时:

  • 工具调用不准,先看 ReAct 和 Toolformer。
  • 规划容易走偏,先看 Tree of Thoughts 和 AutoGPT/BabyAGI。
  • 重复犯错,先看 Reflexion。
  • 长期上下文混乱,先看 Generative Agents。
  • 想沉淀可复用技能,先看 Voyager。

5. 权威资料

  • 论文索引:../99-权威资料索引/论文索引.md
  • 官方文档索引:../99-权威资料索引/官方文档索引.md
  • 开源项目索引:../99-权威资料索引/开源项目索引.md
  • 安全资料索引:../99-权威资料索引/安全资料索引.md
  • 核对日期:2026-05-09