跳到主要内容

总览与学习路径

本目录回答三个问题:什么是 AI Agent,什么时候值得构建 Agent,以及工程团队应该按什么顺序学习和落地。

Agent 不是“带聊天界面的模型”,也不是把多个 API 串起来的流程自动化。工程上更稳妥的定义是:Agent 是由大模型驱动、能在约束范围内理解目标、选择工具、观察环境反馈、更新状态并持续推进任务的系统。它的核心不是“拟人化智能”,而是模型在执行循环中对工作流控制权的获得。

建议阅读顺序

顺序文件解决的问题
1AI-Agent全景图.md建立整体架构地图,知道 Agent 系统由哪些层组成
2Agent与Chatbot-Workflow-Copilot-RPA的区别.md判断一个需求是否真的需要 Agent
3Agent能力成熟度模型.md用 L0-L5 评估团队当前能力、上线门槛与下一阶段建设重点
4如何学习和构建Agent系统.md给出从学习到上线的路线图
5../01-Agent基础理论/README.md进入执行循环、ReAct、Reflection、HITL、失败模式等基础理论

全局架构地图

目录内的判断原则

  1. 先证明简单方案不够,再引入 Agent。 Anthropic 的工程建议和 OpenAI 的 agent 指南都强调:Agent 会带来更高成本、延迟和错误扩散风险。固定路径任务优先用 workflow;只有在步骤数量、工具选择或上下文判断难以预先编码时,才让模型控制执行流程。

  2. Agent 的能力来自“模型 + 工具 + 状态 + 反馈”,不是单靠提示词。 高质量 prompt 很重要,但生产 Agent 的可靠性更多取决于工具接口、权限边界、状态压缩、失败恢复、评测集和链路追踪。

  3. 自主性必须分级开放。 读取类工具、可回滚写入、不可回滚操作、资金/合规/安全动作应采用不同审批策略。高风险动作默认需要人类在环(Human-in-the-loop)。

  4. 评测要覆盖轨迹,而不只是最终回答。 Agent 的失败常发生在中间步骤:选错工具、传错参数、忽略观察结果、循环过久、越权调用。只看最终答案会漏掉大量生产风险。

  5. 上线后仍要持续回放和更新。 Agent 是一个带概率行为的执行系统,需求、工具、模型、数据、权限都会变化。生产系统必须保留 trace、审计日志和失败样本闭环。

最小工程交付面

一个可进入灰度的 Agent 项目至少应包含:

模块最低要求
任务定义明确目标、退出条件、失败升级条件、不可做事项
工具契约schema、权限级别、幂等性、错误码、示例输入输出
状态管理会话状态、任务状态、计划、工具结果、摘要或记忆策略
Agent Loop最大步数、超时、重试、终止判断、异常处理
护栏输入校验、输出校验、敏感数据处理、高风险工具审批
评测离线任务集、轨迹评测、工具调用准确率、回归测试
观测trace、span、成本、延迟、失败类型、人工接管记录
发布沙箱、灰度、回滚、权限隔离、审计

反模式总览

反模式表现后果
把聊天机器人包装成 Agent只有问答,没有工具和状态无法完成真实任务
万能 Agent一个 Agent 挂几十个相似工具工具选择混乱、评测困难
无退出条件循环只让模型“继续直到完成”成本失控、死循环、重复操作
无权限分层所有工具默认可调用数据泄漏、越权写入、合规风险
只测最终答案不记录中间轨迹难以定位选错工具或误用数据
用 prompt 替代系统控制依靠一句“不要做危险操作”无法抵御提示注入和工具投毒

与其他目录的关系

  • 基础理论:见 ../01-Agent基础理论/README.md
  • 后续目录应在本目录给出的边界与成熟度模型上展开:工具调用、MCP、RAG、记忆、规划、多 Agent、评测、安全、运维都应服务于可控的 Agent 执行系统。

权威资料