Agent与Chatbot-Workflow-Copilot-RPA的区别
1. 定义与边界
这些形态都可能使用大模型,但工程控制权不同。
| 形态 | 控制权 | 典型输入 | 是否行动 | 是否动态规划 | 典型例子 |
|---|---|---|---|---|---|
| Chatbot | 用户与对话系统 | 问题、闲聊、咨询 | 通常不行动 | 否 | FAQ、客服问答 |
| Workflow | 程序预定义流程 | 表单、事件、固定请求 | 是 | 否或很少 | 审批流、ETL、工单流 |
| Copilot | 人控制主流程,模型辅助 | 人当前上下文 | 通常建议或局部执行 | 局部 | 代码补全、办公助手 |
| RPA | 脚本/规则控制 UI 或系统 | 结构化任务 | 是 | 否 | 录屏式自动填表、批量搬运 |
| Agent | 模型参与控制执行循环 | 目标、约束、环境反馈 | 是 | 是 | 编程 Agent、研究 Agent、客服行动 Agent |
一句话判断:如果系统只是回答,它是 Chatbot;如果路径固定,它是 Workflow 或 RPA;如果人持续掌舵,它是 Copilot;如果模型在循环中决定下一步并调用工具推进任务,它才是 Agent。
2. 为什么重要
混淆概念会导致架构过度设计或风险低估:
- 把 FAQ 做成 Agent,会增加成本、延迟和安全面。
- 把需要探索的任务写死成 workflow,会导致异常路径维护爆炸。
- 把 Copilot 当 Agent,会高估系统自主完成任务的能力。
- 把 RPA 当 Agent,会忽略语义判断、状态管理和错误恢复。
- 把 Agent 当普通 Chatbot,会漏掉权限、审计、审批和工具风险。
3. 形态决策树
选型时不要先问“能不能用 Agent”,而要问“谁控制下一步、是否需要行动、行动风险能否被系统约束”。
判断口诀:
| 问题 | 如果答案是“是” | 更可能的形态 |
|---|---|---|
| 只需要回答、解释、引用资料吗 | 不需要外部副作用 | Chatbot/RAG |
| 步骤能画成稳定流程图吗 | 分支有限、规则清楚 | Workflow |
| 人要实时审阅和决定每一步吗 | 模型只是辅助 | Copilot |
| 系统只能通过 UI 操作遗留应用吗 | API 不可用 | RPA |
| 步骤依赖中间观察结果动态变化吗 | 工具选择和顺序不可预写 | Agent |
4. 核心机制对比
Chatbot
Chatbot 的核心是自然语言交互。它可以接入 RAG 或工具,但如果工具使用只是固定的“先检索再回答”,没有任务状态和执行循环,仍然不是完整 Agent。
工程重点:知识准确性、意图识别、多轮上下文、拒答策略、召回与引用。
Workflow
Workflow 的核心是预定义步骤。Anthropic 将 workflow 定义为 LLM 和工具通过预定义代码路径被编排的系统。它可以包含 LLM 节点,但流程控制权在代码。
工程重点:状态机、幂等、重试、补偿事务、审批、SLA。
Copilot
Copilot 的核心是增强人的操作。模型在局部上下文中给建议、生成草稿、补全代码或解释内容。人负责选择、确认和最终执行。
工程重点:低延迟、上下文感知、可编辑输出、用户控制、撤销。
RPA
RPA 的核心是用软件机器人模拟人对 UI 或系统的操作。UiPath 等 RPA 平台通常强调软件机器人执行重复、基于规则的数字任务。RPA 可与 LLM 结合处理非结构化输入,但传统 RPA 的主路径仍是规则和脚本。
工程重点:UI 稳定性、凭据管理、异常队列、审计、批量执行。
Agent
Agent 的核心是模型动态控制流程。OpenAI 指出 Agent 能代表用户独立完成任务,并使用工具与外部系统交互。Anthropic 将 Agent 描述为模型动态指导流程和工具使用,并根据环境反馈继续推进。
工程重点:Agent Loop、工具契约、状态、评测、护栏、人类在环、trace。
5. 真实场景判断
| 需求特征 | 推荐形态 | 原因 |
|---|---|---|
| 固定审批流 | Workflow | 可预测、易审计、低成本 |
| 大量重复 UI 操作 | RPA | 对遗留系统更现实 |
| 用户边做边问 | Copilot | 人掌控主流程 |
| 文档问答 | Chatbot/RAG | 不需要行动循环 |
| 客服问题需要查订单、判断政策、创建工单 | Workflow + 局部 Agent | 主流程可控,复杂判断交给 Agent |
| 代码库迁移、研究、多步骤排错 | Agent | 步骤不可预知,需要探索和反馈 |
误用案例
| 误用 | 现场表现 | 更合适做法 |
|---|---|---|
| FAQ 做成 Agent | 每次回答都走多轮工具调用,延迟高且答案不稳定 | RAG Chatbot,必要时加引用和拒答 |
| 固定报销流做成 Agent | Agent 偶尔跳过审批或重复提交 | Workflow + LLM 文本抽取节点 |
| Copilot 自动发外部邮件 | 用户以为只是草稿,系统已经发出 | Copilot 保持建议态,发送前显式确认 |
| RPA 加 LLM 后无沙箱 | LLM 猜测按钮位置并误点生产系统 | RPA 负责确定性 UI 操作,LLM 只做字段理解 |
| Agent 接通万能 HTTP 工具 | 模型可访问任意域名和内部 API | 工具 allowlist、域名 allowlist、风险审批 |
6. 工程实现差异
Workflow 示例
def refund_workflow(order_id):
order = get_order(order_id)
if not order.refundable:
return reject("policy_not_matched")
ticket = create_refund_ticket(order_id)
notify_user(ticket)
return ticket
Agent 示例
def refund_agent(goal):
state = init_state(goal)
while not state.done:
decision = llm.choose_next_action(state, tools=["get_order", "read_policy", "create_ticket"])
result = call_tool_with_policy(decision)
state = update_state(state, decision, result)
return state.final_output
区别不在有没有 LLM,而在下一步是由固定代码决定,还是由模型基于状态和反馈决定。
同一需求的三种落地方式
以“客户要求退款”为例:
| 实现 | 控制流 | 适用阶段 |
|---|---|---|
| Workflow | 查订单 -> 查政策 -> 满足则建单 -> 通知 | 政策简单、分支稳定 |
| Copilot | 模型生成处理建议,客服确认后执行 | 需要人工判断、风险中等 |
| Agent | 模型根据订单、政策、物流、用户补充信息动态选择工具 | 异常多、资料分散、需多步探索 |
生产上常用组合不是纯 Agent,而是:Workflow 负责入口、权限、审批和状态机,Agent 只负责不确定的判断与信息收集。
7. 生产实践
| 形态 | 主要生产风险 | 控制手段 |
|---|---|---|
| Chatbot | 幻觉、错误引用、越界回答 | RAG 评测、引用、拒答、内容安全 |
| Workflow | 规则漂移、异常路径遗漏 | 状态机、回归测试、可观测、异常队列 |
| Copilot | 用户误采纳、上下文泄漏 | 明确建议态、权限隔离、撤销、代码审查 |
| RPA | UI 变化导致失败、凭据滥用 | 选择器稳定性、凭据库、异常处理 |
| Agent | 错误扩散、越权行动、成本失控 | 最大步数、工具权限、审批、trace、evals |
8. 常见反模式
| 反模式 | 失败后果 | 修正方式 |
|---|---|---|
| 为了“显得智能”把固定流程改成 Agent | 成本和延迟上升,结果更不可预测 | 固定路径保留 workflow,只在非结构化节点用 LLM |
| 在 Copilot 中偷偷自动执行不可逆动作 | 用户控制感被破坏,责任边界不清 | 输出保持草稿态,执行前给出参数和影响预览 |
| RPA 失败后让 LLM 随机猜 UI 操作 | 误点、重复提交、难以审计 | 选择器失败进入异常队列或人工接管 |
| Chatbot 接了写入工具 | 问答系统变成无治理执行系统 | 拆成 Agent,补权限、审批、trace 和评测 |
| Agent 没有业务成功标准 | 模型“尽力”但无法验收 | 定义 success/failure/escalation 条件 |
9. 评测方法
| 形态 | 评测重点 |
|---|---|
| Chatbot | 回答准确率、引用支持率、拒答正确率、用户满意度 |
| Workflow | 流程成功率、异常覆盖、SLA、补偿事务成功率 |
| Copilot | 建议采纳率、修改距离、节省时间、误导率 |
| RPA | 批处理成功率、异常队列率、平均处理时长 |
| Agent | 任务成功率、工具调用准确率、平均步数、人工接管率、安全拦截率 |
评测形态也不同:Chatbot 主要看答案,Workflow 主要看路径覆盖,Copilot 主要看人是否能高效修订,Agent 必须看完整轨迹。一个 Agent 样本至少要记录输入、允许工具、禁止工具、预期最终状态、关键中间证据和安全红线。
10. 安全与治理
Agent 和 RPA 都能行动,但风险来源不同:
- RPA 风险主要来自凭据、UI 误操作、脚本越权和异常处理不足。
- Agent 风险还包括 prompt injection、工具投毒、模型错误推理、上下文污染和过度自主。
- Copilot 要防止用户把模型建议误认为已验证事实。
- Workflow 要防止规则漏洞被批量利用。
治理上应按“能否行动、是否可逆、是否涉及敏感数据、是否跨系统”划分风险,而不是按产品名字划分。
11. 权威资料
- OpenAI, A practical guide to building agents: https://openai.com/business/guides-and-resources/a-practical-guide-to-building-ai-agents/ (核对日期:2026-05-09)
- Anthropic, Building effective agents: https://www.anthropic.com/engineering/building-effective-agents (核对日期:2026-05-09)
- Microsoft Copilot Studio docs: https://learn.microsoft.com/en-us/microsoft-copilot-studio/ (核对日期:2026-05-09)
- Microsoft Power Automate docs: https://learn.microsoft.com/en-us/power-automate/ (核对日期:2026-05-09)
- UiPath, Robotic Process Automation: https://www.uipath.com/rpa/robotic-process-automation (核对日期:2026-05-09)
- IBM, What are AI agents?: https://www.ibm.com/think/topics/ai-agents (核对日期:2026-05-09)
- OWASP Top 10 for LLM Applications: https://owasp.org/www-project-top-10-for-large-language-model-applications/ (核对日期:2026-05-09)