跳到主要内容

经典论文与方法

本目录整理 AI Agent 领域中最常被引用、也最容易被误用的经典论文和早期开源实践。

阅读目标不是背论文标题，而是判断：

它解决哪类 Agent 能力问题。
它的证据来自什么实验或实践环境。
它对现代工程系统有什么可借鉴结构。
它有哪些不能照搬到生产的边界。

1. 阅读路径

顺序	文件	关注问题	读完应能判断
1	ReAct	推理、行动和观察如何组成 Agent Loop	什么时候需要多步工具循环，如何记录 trace
2	Toolformer	模型如何学习工具调用模式	工具调用为什么需要数据和评测
3	Tree of Thoughts	如何搜索多个候选推理状态	什么时候值得用搜索式规划
4	Reflexion	失败反馈如何变成下一轮经验	反思依赖什么评估器，如何避免错误记忆
5	Generative Agents	长期记忆如何影响行为	记忆流、反思和计划如何组合
6	Voyager	技能如何在开放环境中积累	技能库如何验证、入库和复用
7	AutoGPT 与 BabyAGI	早期开源自主循环暴露了什么问题	为什么“全自主”必须先受权限、预算和终止条件约束
8	Agent 论文脉络	按能力维度串联所有资料	如何按工具、规划、记忆、反思、多 Agent、评测、安全选方法

2. 能力地图

3. 阅读提醒

论文实验通常发生在受控任务、受控工具和特定模型设置中。
论文中的方法结构可以借鉴，但生产系统必须补齐权限、审计、评测、成本和安全。
AutoGPT 和 BabyAGI 是早期开源实践，不是严格论文证据。
所有“最新平台能力”和“当前 SDK 用法”要回到 ../99-权威资料索引/官方文档索引.md 核对。

4. 推荐使用方式

学习时：

先读每篇的“背景问题”和“方法结构”。
再看“实验设置与证据边界”。
最后重点看“今天工程系统如何借鉴”和“不能直接照搬的地方”。

做技术路线判断时：

工具调用不准，先看 ReAct 和 Toolformer。
规划容易走偏，先看 Tree of Thoughts 和 AutoGPT/BabyAGI。
重复犯错，先看 Reflexion。
长期上下文混乱，先看 Generative Agents。
想沉淀可复用技能，先看 Voyager。

5. 权威资料

论文索引：../99-权威资料索引/论文索引.md
官方文档索引：../99-权威资料索引/官方文档索引.md
开源项目索引：../99-权威资料索引/开源项目索引.md
安全资料索引：../99-权威资料索引/安全资料索引.md
核对日期：2026-05-09

1. 阅读路径
2. 能力地图
3. 阅读提醒
4. 推荐使用方式
5. 权威资料