总览与学习路径
本目录回答三个问题:什么是 AI Agent,什么时候值得构建 Agent,以及工程团队应该按什么顺序学习和落地。
Agent 不是“带聊天界面的模型”,也不是把多个 API 串起来的流程自动化。工程上更稳妥的定义是:Agent 是由大模型驱动、能在约束范围内理解目标、选择工具、观察环境反馈、更新状态并持续推进任务的系统。它的核心不是“拟人化智能”,而是模型在执行循环中对工作流控制权的获得。
建议阅读顺序
| 顺序 | 文件 | 解决的问题 |
|---|---|---|
| 1 | AI-Agent全景图.md | 建立整体架构地图,知道 Agent 系统由哪些层组成 |
| 2 | Agent与Chatbot-Workflow-Copilot-RPA的区别.md | 判断一个需求是否真的需要 Agent |
| 3 | Agent能力成熟度模型.md | 用 L0-L5 评估团队当前能力、上线门槛与下一阶段建设重点 |
| 4 | 如何学习和构建Agent系统.md | 给出从学习到上线的路线图 |
| 5 | ../01-Agent基础理论/README.md | 进入执行循环、ReAct、Reflection、HITL、失败模式等基础理论 |
全局架构地图
目录内的判断原则
-
先证明简单方案不够,再引入 Agent。 Anthropic 的工程建议和 OpenAI 的 agent 指南都强调:Agent 会带来更高成本、延迟和错误扩散风险。固定路径任务优先用 workflow;只有在步骤数量、工具选择或上下文判断难以预先编码时,才让模型控制执行流程。
-
Agent 的能力来自“模型 + 工具 + 状态 + 反馈”,不是单靠提示词。 高质量 prompt 很重要,但生产 Agent 的可靠性更多取决于工具接口、权限边界、状态压缩、失败恢复、评测集和链路追踪。
-
自主性必须分级开放。 读取类工具、可回滚写入、不可回滚操作、资金/合规/安全动作应采用不同审批策略。高风险动作默认需要人类在环(Human-in-the-loop)。
-
评测要覆盖轨迹,而不只是最终回答。 Agent 的失败常发生在中间步骤:选错工具、传错参数、忽略观察结果、循环过久、越权调用。只看最终答案会漏掉大量生产风险。
-
上线后仍要持续回放和更新。 Agent 是一个带概率行为的执行系统,需求、工具、模型、数据、权限都会变化。生产系统必须保留 trace、审计日志和失败样本闭环。
最小工程交付面
一个可进入灰度的 Agent 项目至少应包含:
| 模块 | 最低要求 |
|---|---|
| 任务定义 | 明确目标、退出条件、失败升级条件、不可做事项 |
| 工具契约 | schema、权限级别、幂等性、错误码、示例输入输出 |
| 状态管理 | 会话状态、任务状态、计划、工具结果、摘要或记忆策略 |
| Agent Loop | 最大步数、超时、重试、终止判断、异常处理 |
| 护栏 | 输入校验、输出校验、敏感数据处理、高风险工具审批 |
| 评测 | 离线任务集、轨迹评测、工具调用准确率、回归测试 |
| 观测 | trace、span、成本、延迟、失败类型、人工接管记录 |
| 发布 | 沙箱、灰度、回滚、权限隔离、审计 |
反模式总览
| 反模式 | 表现 | 后果 |
|---|---|---|
| 把聊天机器人包装成 Agent | 只有问答,没有工具和状态 | 无法完成真实任务 |
| 万能 Agent | 一个 Agent 挂几十个相似工具 | 工具选择混乱、评测困难 |
| 无退出条件循环 | 只让模型“继续直到完成” | 成本失控、死循环、重复操作 |
| 无权限分层 | 所有工具默认可调用 | 数据泄漏、越权写入、合规风险 |
| 只测最终答案 | 不记录中间轨迹 | 难以定位选错工具或误用数据 |
| 用 prompt 替代系统控制 | 依靠一句“不要做危险操作” | 无法抵御提示注入和工具投毒 |
与其他目录的关系
- 基础理论:见 ../01-Agent基础理论/README.md。
- 后续目录应在本目录给出的边界与成熟度模型上展开:工具调用、MCP、RAG、记忆、规划、多 Agent、评测、安全、运维都应服务于可控的 Agent 执行系统。
权威资料
- OpenAI, A practical guide to building agents: https://openai.com/business/guides-and-resources/a-practical-guide-to-building-ai-agents/ (核对日期:2026-05-09)
- OpenAI Agents SDK docs: https://openai.github.io/openai-agents-python/ (核对日期:2026-05-09)
- Anthropic, Building effective agents: https://www.anthropic.com/engineering/building-effective-agents (核对日期:2026-05-09)
- Anthropic, Effective context engineering for AI agents: https://www.anthropic.com/engineering/effective-context-engineering-for-ai-agents (核对日期:2026-05-09)
- LangGraph docs: https://docs.langchain.com/oss/python/langgraph/overview (核对日期:2026-05-09)
- NIST AI Risk Management Framework: https://www.nist.gov/itl/ai-risk-management-framework (核对日期:2026-05-09)
- OWASP Top 10 for LLM Applications: https://owasp.org/www-project-top-10-for-large-language-model-applications/ (核对日期:2026-05-09)