总览与学习路径

本目录回答三个问题：什么是 AI Agent，什么时候值得构建 Agent，以及工程团队应该按什么顺序学习和落地。

Agent 不是“带聊天界面的模型”，也不是把多个 API 串起来的流程自动化。工程上更稳妥的定义是：Agent 是由大模型驱动、能在约束范围内理解目标、选择工具、观察环境反馈、更新状态并持续推进任务的系统。它的核心不是“拟人化智能”，而是模型在执行循环中对工作流控制权的获得。

建议阅读顺序

顺序	文件	解决的问题
1	AI-Agent全景图.md	建立整体架构地图，知道 Agent 系统由哪些层组成
2	Agent与Chatbot-Workflow-Copilot-RPA的区别.md	判断一个需求是否真的需要 Agent
3	Agent能力成熟度模型.md	用 L0-L5 评估团队当前能力、上线门槛与下一阶段建设重点
4	如何学习和构建Agent系统.md	给出从学习到上线的路线图
5	../01-Agent基础理论/README.md	进入执行循环、ReAct、Reflection、HITL、失败模式等基础理论

先证明简单方案不够，再引入 Agent。 Anthropic 的工程建议和 OpenAI 的 agent 指南都强调：Agent 会带来更高成本、延迟和错误扩散风险。固定路径任务优先用 workflow；只有在步骤数量、工具选择或上下文判断难以预先编码时，才让模型控制执行流程。
Agent 的能力来自“模型 + 工具 + 状态 + 反馈”，不是单靠提示词。高质量 prompt 很重要，但生产 Agent 的可靠性更多取决于工具接口、权限边界、状态压缩、失败恢复、评测集和链路追踪。
自主性必须分级开放。读取类工具、可回滚写入、不可回滚操作、资金/合规/安全动作应采用不同审批策略。高风险动作默认需要人类在环（Human-in-the-loop）。
评测要覆盖轨迹，而不只是最终回答。 Agent 的失败常发生在中间步骤：选错工具、传错参数、忽略观察结果、循环过久、越权调用。只看最终答案会漏掉大量生产风险。
上线后仍要持续回放和更新。 Agent 是一个带概率行为的执行系统，需求、工具、模型、数据、权限都会变化。生产系统必须保留 trace、审计日志和失败样本闭环。

一个可进入灰度的 Agent 项目至少应包含：

OpenAI, A practical guide to building agents: https://openai.com/business/guides-and-resources/a-practical-guide-to-building-ai-agents/ （核对日期：2026-05-09）
OpenAI Agents SDK docs: https://openai.github.io/openai-agents-python/ （核对日期：2026-05-09）
Anthropic, Building effective agents: https://www.anthropic.com/engineering/building-effective-agents （核对日期：2026-05-09）
Anthropic, Effective context engineering for AI agents: https://www.anthropic.com/engineering/effective-context-engineering-for-ai-agents （核对日期：2026-05-09）
LangGraph docs: https://docs.langchain.com/oss/python/langgraph/overview （核对日期：2026-05-09）
NIST AI Risk Management Framework: https://www.nist.gov/itl/ai-risk-management-framework （核对日期：2026-05-09）
OWASP Top 10 for LLM Applications: https://owasp.org/www-project-top-10-for-large-language-model-applications/ （核对日期：2026-05-09）