术语表
本术语表用于本知识库内部统一表达。
若与项目控制台术语表冲突,以 ../00-项目控制台/03-术语统一表.md 为准。
1. 使用原则
- 首次出现英文术语时建议使用“中文名(English Term)”。
- 同一文件内术语保持一致。
- 不把 Agent 泛化为任何聊天机器人。
- 不把 Memory 和 RAG 混用。
- 不把框架宣传语当作术语定义。
2. 核心术语
| 术语 | 建议中文 | 类型 | 说明 | 常见误用 |
|---|---|---|---|---|
| Agent | Agent / 智能体 | 核心概念 | 能基于目标、上下文、状态和工具执行多步任务的系统 | 把普通聊天机器人都叫 Agent |
| Agent Loop | Agent 执行循环 | 架构 | 感知、决策、行动、观察、状态更新和终止判断 | 只写 while true,不设计终止条件 |
| Tool Calling | 工具调用 | 能力 | 模型或 Agent 选择外部工具并生成结构化参数 | 认为能输出 JSON 就等于可靠工具调用 |
| Function Calling | 函数调用 | 能力 | 模型输出函数名和参数,通常由应用执行函数 | 忽略函数执行的权限和副作用 |
| MCP | Model Context Protocol | 协议 | 连接 AI 应用与工具、资源、提示词的开放协议 | 把 MCP 当成 Agent 框架 |
| RAG | 检索增强生成 | 架构 | 从外部知识源检索上下文,再交给模型生成 | 把所有长期记忆都叫 RAG |
| Memory | 记忆 | 状态 | Agent 跨轮次或跨任务保留事件、偏好、经验的机制 | 无边界保存聊天历史 |
| Planner | 规划器 | 组件 | 将目标拆成步骤、候选计划或任务队列 | 只生成步骤,不考虑验证和预算 |
| Executor | 执行器 | 组件 | 根据计划调用工具或执行动作 | 缺少权限检查和幂等控制 |
| Reflection | 反思 | 方法 | 对轨迹、失败或输出进行评估并生成修正经验 | 把模型自评当作事实 |
| Human-in-the-loop | 人类在环 | 治理 | 人类参与审批、纠错、反馈或决策 | 只在 UI 上放确认按钮,没有责任记录 |
| Guardrails | 护栏 | 治理 | 输入、输出、工具、权限和策略约束 | 只做关键词过滤 |
| Trace | 轨迹 / 链路追踪 | 观测 | 一次 Agent 执行的完整事件记录 | 只保存最终答案 |
| Span | 跟踪片段 | 观测 | Trace 中的单个模型调用、工具调用或审批步骤 | 不记录工具参数和错误 |
| Task Success Rate | 任务成功率 | 评测 | 任务最终是否按标准完成 | 只看用户是否点了满意 |
| Tool Call Accuracy | 工具调用准确率 | 评测 | 是否在正确时机调用正确工具并传入正确参数 | 只看是否调用成功 |
| Prompt Injection | 提示注入 | 安全 | 外部内容诱导模型违背开发者或系统意图 | 只把用户输入当风险 |
| Data Exfiltration | 数据外泄 | 安全 | 敏感数据泄露给未授权主体或工具 | 只关注模型输出,不关注工具和日志 |
| Tool Poisoning | 工具投毒 | 安全 | 恶意工具描述、schema 或返回内容诱导错误行为 | 默认工具描述可信 |
| Skill Library | 技能库 | 方法 | 保存可复用动作、代码、脚本或流程的知识库 | 把普通文档库叫技能库 |
| Evaluator | 评估器 | 组件 | 判断输出、轨迹或候选计划质量的规则、测试或模型 | 只让同一个模型自评 |
| State | 状态 | 架构 | Agent 当前上下文、任务进度、记忆引用和中间结果 | 把所有历史消息当状态 |
| Handoff | 移交 | 架构 | 一个 Agent 将任务交给另一个 Agent 或人工处理 | 没有移交条件和责任边界 |
3. 论文相关术语
| 术语 | 来源 | 含义 | 工程提醒 |
|---|---|---|---|
| Thought | ReAct / ToT | 中间推理或候选状态 | 生产中更适合保存决策摘要和 trace,不必公开完整推理 |
| Action | ReAct | 工具调用或环境动作 | 必须有权限、schema 和审计 |
| Observation | ReAct | 工具或环境返回 | 视为不可信输入,需要过滤和引用 |
| Verbal Reinforcement | Reflexion | 用语言反馈影响下一轮尝试 | 不等于参数更新 |
| Memory Stream | Generative Agents | 持续追加的事件记忆流 | 需要权限、有效期和删除机制 |
| Automatic Curriculum | Voyager | 自动选择下一探索目标 | 生产中不能让 Agent 自造高风险目标 |
| Skill | Voyager | 可复用代码或动作能力 | 入库前必须验证 |
| Search Tree | Tree of Thoughts | 多候选中间状态组成的搜索结构 | 需要预算和 evaluator |
4. 术语判断清单
写文档时遇到概念混乱,可用以下问题校准:
- 这个系统是否有目标、状态、工具和终止条件。
- 这个“记忆”是外部知识、用户偏好、任务经验还是聊天历史。
- 这个“反思”是否有评估器和证据。
- 这个“工具调用”是否记录了参数、权限和结果。
- 这个“多 Agent”是否有共享状态和责任边界。
5. 权威资料
- 项目术语统一表:../00-项目控制台/03-术语统一表.md
- MCP docs: https://modelcontextprotocol.io/docs
- OpenAI Agents SDK docs: https://openai.github.io/openai-agents-python/
- OWASP LLM Top 10: https://owasp.org/www-project-top-10-for-large-language-model-applications/
- 核对日期:2026-05-09