跳到主要内容

Agent与Chatbot-Workflow-Copilot-RPA的区别

1. 定义与边界

这些形态都可能使用大模型,但工程控制权不同。

形态控制权典型输入是否行动是否动态规划典型例子
Chatbot用户与对话系统问题、闲聊、咨询通常不行动FAQ、客服问答
Workflow程序预定义流程表单、事件、固定请求否或很少审批流、ETL、工单流
Copilot人控制主流程,模型辅助人当前上下文通常建议或局部执行局部代码补全、办公助手
RPA脚本/规则控制 UI 或系统结构化任务录屏式自动填表、批量搬运
Agent模型参与控制执行循环目标、约束、环境反馈编程 Agent、研究 Agent、客服行动 Agent

一句话判断:如果系统只是回答,它是 Chatbot;如果路径固定,它是 Workflow 或 RPA;如果人持续掌舵,它是 Copilot;如果模型在循环中决定下一步并调用工具推进任务,它才是 Agent。

2. 为什么重要

混淆概念会导致架构过度设计或风险低估:

  • 把 FAQ 做成 Agent,会增加成本、延迟和安全面。
  • 把需要探索的任务写死成 workflow,会导致异常路径维护爆炸。
  • 把 Copilot 当 Agent,会高估系统自主完成任务的能力。
  • 把 RPA 当 Agent,会忽略语义判断、状态管理和错误恢复。
  • 把 Agent 当普通 Chatbot,会漏掉权限、审计、审批和工具风险。

3. 形态决策树

选型时不要先问“能不能用 Agent”,而要问“谁控制下一步、是否需要行动、行动风险能否被系统约束”。

判断口诀:

问题如果答案是“是”更可能的形态
只需要回答、解释、引用资料吗不需要外部副作用Chatbot/RAG
步骤能画成稳定流程图吗分支有限、规则清楚Workflow
人要实时审阅和决定每一步吗模型只是辅助Copilot
系统只能通过 UI 操作遗留应用吗API 不可用RPA
步骤依赖中间观察结果动态变化吗工具选择和顺序不可预写Agent

4. 核心机制对比

Chatbot

Chatbot 的核心是自然语言交互。它可以接入 RAG 或工具,但如果工具使用只是固定的“先检索再回答”,没有任务状态和执行循环,仍然不是完整 Agent。

工程重点:知识准确性、意图识别、多轮上下文、拒答策略、召回与引用。

Workflow

Workflow 的核心是预定义步骤。Anthropic 将 workflow 定义为 LLM 和工具通过预定义代码路径被编排的系统。它可以包含 LLM 节点,但流程控制权在代码。

工程重点:状态机、幂等、重试、补偿事务、审批、SLA。

Copilot

Copilot 的核心是增强人的操作。模型在局部上下文中给建议、生成草稿、补全代码或解释内容。人负责选择、确认和最终执行。

工程重点:低延迟、上下文感知、可编辑输出、用户控制、撤销。

RPA

RPA 的核心是用软件机器人模拟人对 UI 或系统的操作。UiPath 等 RPA 平台通常强调软件机器人执行重复、基于规则的数字任务。RPA 可与 LLM 结合处理非结构化输入,但传统 RPA 的主路径仍是规则和脚本。

工程重点:UI 稳定性、凭据管理、异常队列、审计、批量执行。

Agent

Agent 的核心是模型动态控制流程。OpenAI 指出 Agent 能代表用户独立完成任务,并使用工具与外部系统交互。Anthropic 将 Agent 描述为模型动态指导流程和工具使用,并根据环境反馈继续推进。

工程重点:Agent Loop、工具契约、状态、评测、护栏、人类在环、trace。

5. 真实场景判断

需求特征推荐形态原因
固定审批流Workflow可预测、易审计、低成本
大量重复 UI 操作RPA对遗留系统更现实
用户边做边问Copilot人掌控主流程
文档问答Chatbot/RAG不需要行动循环
客服问题需要查订单、判断政策、创建工单Workflow + 局部 Agent主流程可控,复杂判断交给 Agent
代码库迁移、研究、多步骤排错Agent步骤不可预知,需要探索和反馈

误用案例

误用现场表现更合适做法
FAQ 做成 Agent每次回答都走多轮工具调用,延迟高且答案不稳定RAG Chatbot,必要时加引用和拒答
固定报销流做成 AgentAgent 偶尔跳过审批或重复提交Workflow + LLM 文本抽取节点
Copilot 自动发外部邮件用户以为只是草稿,系统已经发出Copilot 保持建议态,发送前显式确认
RPA 加 LLM 后无沙箱LLM 猜测按钮位置并误点生产系统RPA 负责确定性 UI 操作,LLM 只做字段理解
Agent 接通万能 HTTP 工具模型可访问任意域名和内部 API工具 allowlist、域名 allowlist、风险审批

6. 工程实现差异

Workflow 示例

def refund_workflow(order_id):
order = get_order(order_id)
if not order.refundable:
return reject("policy_not_matched")
ticket = create_refund_ticket(order_id)
notify_user(ticket)
return ticket

Agent 示例

def refund_agent(goal):
state = init_state(goal)
while not state.done:
decision = llm.choose_next_action(state, tools=["get_order", "read_policy", "create_ticket"])
result = call_tool_with_policy(decision)
state = update_state(state, decision, result)
return state.final_output

区别不在有没有 LLM,而在下一步是由固定代码决定,还是由模型基于状态和反馈决定。

同一需求的三种落地方式

以“客户要求退款”为例:

实现控制流适用阶段
Workflow查订单 -> 查政策 -> 满足则建单 -> 通知政策简单、分支稳定
Copilot模型生成处理建议,客服确认后执行需要人工判断、风险中等
Agent模型根据订单、政策、物流、用户补充信息动态选择工具异常多、资料分散、需多步探索

生产上常用组合不是纯 Agent,而是:Workflow 负责入口、权限、审批和状态机,Agent 只负责不确定的判断与信息收集。

7. 生产实践

形态主要生产风险控制手段
Chatbot幻觉、错误引用、越界回答RAG 评测、引用、拒答、内容安全
Workflow规则漂移、异常路径遗漏状态机、回归测试、可观测、异常队列
Copilot用户误采纳、上下文泄漏明确建议态、权限隔离、撤销、代码审查
RPAUI 变化导致失败、凭据滥用选择器稳定性、凭据库、异常处理
Agent错误扩散、越权行动、成本失控最大步数、工具权限、审批、trace、evals

8. 常见反模式

反模式失败后果修正方式
为了“显得智能”把固定流程改成 Agent成本和延迟上升,结果更不可预测固定路径保留 workflow,只在非结构化节点用 LLM
在 Copilot 中偷偷自动执行不可逆动作用户控制感被破坏,责任边界不清输出保持草稿态,执行前给出参数和影响预览
RPA 失败后让 LLM 随机猜 UI 操作误点、重复提交、难以审计选择器失败进入异常队列或人工接管
Chatbot 接了写入工具问答系统变成无治理执行系统拆成 Agent,补权限、审批、trace 和评测
Agent 没有业务成功标准模型“尽力”但无法验收定义 success/failure/escalation 条件

9. 评测方法

形态评测重点
Chatbot回答准确率、引用支持率、拒答正确率、用户满意度
Workflow流程成功率、异常覆盖、SLA、补偿事务成功率
Copilot建议采纳率、修改距离、节省时间、误导率
RPA批处理成功率、异常队列率、平均处理时长
Agent任务成功率、工具调用准确率、平均步数、人工接管率、安全拦截率

评测形态也不同:Chatbot 主要看答案,Workflow 主要看路径覆盖,Copilot 主要看人是否能高效修订,Agent 必须看完整轨迹。一个 Agent 样本至少要记录输入、允许工具、禁止工具、预期最终状态、关键中间证据和安全红线。

10. 安全与治理

Agent 和 RPA 都能行动,但风险来源不同:

  • RPA 风险主要来自凭据、UI 误操作、脚本越权和异常处理不足。
  • Agent 风险还包括 prompt injection、工具投毒、模型错误推理、上下文污染和过度自主。
  • Copilot 要防止用户把模型建议误认为已验证事实。
  • Workflow 要防止规则漏洞被批量利用。

治理上应按“能否行动、是否可逆、是否涉及敏感数据、是否跨系统”划分风险,而不是按产品名字划分。

11. 权威资料