个人助理Agent

个人助理 Agent 面向日程、邮件、待办、文件、个人知识和轻量自动化。它看似低风险，但往往拥有用户邮箱、日历、联系人和文件权限，因此必须按最小权限、显式确认和可撤销授权设计。

1. 需求边界

范围	说明
适合	日程整理、邮件摘要、待办跟踪、会议纪要、个人资料检索
谨慎	发邮件、改日程、共享文件、代表用户承诺
不适合	自动处理敏感关系、绕过用户确认、长期保留无关隐私数据

2. 架构图

3. 工具设计

工具	风险	设计要点
`calendar.search`	L2	时间范围、参与人脱敏
`calendar.create_draft`	L3	先建草稿或预览
`mail.summarize`	L2	只读摘要，敏感邮件标记
`mail.send_draft`	L4	用户确认后发送
`file.search`	L2	按授权文件夹检索
`task.upsert`	L3	写入待办前展示变更

4. 数据流

用户授权工具 scope，并选择可访问账户、文件夹和日历。
Agent 根据任务检索邮件、日程、文件和记忆。
生成建议、草稿或待办变更，写操作进入确认。
执行后保存最小 trace、幂等键和撤销信息。
用户可查看、删除、导出记忆和授权。

5. 权限模型

OAuth scope 最小化，按功能逐步申请。
邮件发送、日程邀请、文件共享属于高风险写操作。
个人记忆分偏好、事实、敏感信息，敏感记忆默认不写入。
多账户之间隔离，工作和个人资料不得混用。
用户随时撤销工具授权和删除记忆。

6. 风险点

风险	控制
误发邮件	草稿优先、确认、收件人高亮
隐私过度收集	最小化记忆、TTL、用户可删除
日程冲突	冲突检测、时区显示、参与人确认
文件误共享	权限预览、外部域名警告
跨账户混淆	账户隔离、上下文标记

7. 评测方案

任务成功率：摘要、查找、建草稿、日程安排、待办更新。
隐私评测：敏感邮件、跨账户、无关文件检索。
工具准确率：时间、收件人、附件、日程参与人。
用户体验：确认次数、撤销率、错误执行率。
记忆质量：写入必要性、过期清理、用户纠错。

8. 上线清单

OAuth scope、授权撤销和数据删除路径可用。
邮件发送、日程邀请、文件共享必须确认。
个人记忆分类、TTL 和删除界面已实现。
多账户隔离和日志脱敏通过测试。
评测覆盖时区、重名联系人、敏感邮件和冲突日程。

9. 项目级设计补充

9.1 业务目标与非目标

项目	设计口径
业务 Owner	个人/团队效率负责人
主要用户	个人用户/团队成员/助理
触发事件	用户安排日程、整理邮件、规划任务或查找个人资料
MVP 工作流	日程协调、邮件摘要、任务拆解、个人知识检索
允许写操作	创建日程、发送草稿、更新待办、生成提醒
核心数据域	日历、邮件、联系人、任务、个人笔记、位置偏好
高风险边界	自动发送邮件、接受邀请、付款、共享隐私内容
ROI 关注点	减少日程协调成本、降低漏办事项、提升个人信息检索成功率

非目标必须提前写进立项文档：

不把 Agent 当成绕过现有审批、审计和权限系统的新入口。
不在证据不足时自动生成业务承诺、法律承诺或财务承诺。
不把一次演示成功当作生产可用，必须经过离线评测、灰度和人工抽检。
不在缺少 owner、数据口径、异常处理和回滚方案时进入自动执行阶段。

9.2 用户旅程与验收点

旅程阶段	用户看到什么	系统必须记录什么	通过标准
任务进入	Agent 复述目标、范围和限制	`session_id`、用户、渠道、输入摘要	95% 以上能正确识别任务类型
检索/诊断	返回候选证据或业务对象	工具名、参数 hash、数据版本	关键事实 100% 有来源
预览	展示将要写入或执行的内容	风险等级、审批策略、幂等键	L3/L4 动作不得静默执行
执行	返回执行结果和失败原因	业务对象 ID、状态码、耗时	重试不产生重复副作用
收尾	给出摘要、后续建议、转人工入口	质检标签、用户反馈、成本	用户可追溯到证据和操作者

9.3 系统架构与边界

架构边界：

渠道层只负责接入和身份透传，不在渠道层拼接越权上下文。
Agent 层负责计划、工具选择、证据组织和失败解释，不直接保存业务主数据。
工具层负责参数校验、幂等、超时、结构化错误和资源级权限。
策略层负责风险分级、审批、速率限制和数据脱敏。
Trace 层负责审计、评测样本沉淀和线上质量复盘。

9.4 数据模型与权限矩阵

{
  "task": {
    "task_id": "tsk_20260509_001",
    "domain": "personal_assistant",
    "intent": "read_then_act",
    "risk_level": "L2|L3|L4",
    "user_id": "u_123",
    "tenant_id": "tenant_a",
    "resource_scope": ["owned", "team_allowed"],
    "evidence_required": true,
    "approval_required": true,
    "idempotency_key": "domain-object-action-hash"
  }
}

数据类别	读取权限	写入权限	保留策略	脱敏要求
用户输入	当前会话 Agent	不回写主系统	按产品合规周期	日志中隐藏个人敏感字段
业务对象	按用户、角色、租户过滤	只允许工具服务写入	跟随业务系统	Trace 只存 ID 和摘要
知识资料	按文档 ACL 和版本过滤	由知识 owner 发布	保留版本号	对外回复不暴露内部标签
工具结果	当前任务可见	不允许模型直接改写	用于审计和评测	参数和返回值分级脱敏
反馈质检	运营、风控、owner	质检系统写入	用于评测集建设	去除个人身份信息

9.5 工具 schema 与执行策略

{
  "name": "personal_assistant.execute_or_preview",
  "description": "Run the 个人助理 Agent workflow with policy-aware preview before side effects.",
  "input_schema": {
    "type": "object",
    "required": ["task_id", "intent", "resource_id", "action", "idempotency_key"],
    "properties": {
      "task_id": {"type": "string"},
      "intent": {"type": "string"},
      "resource_id": {"type": "string"},
      "action": {"type": "string", "enum": ["read", "preview", "execute", "handoff"]},
      "evidence_ids": {"type": "array", "items": {"type": "string"}},
      "approval_token": {"type": "string"},
      "idempotency_key": {"type": "string"}
    }
  }
}

执行策略：

L0/L1：只读检索、公开知识查询，可自动执行，但仍要记录 trace。
L2：读取个人或部门数据，必须通过资源级权限校验和最小字段返回。
L3：创建、更新、提交类动作，必须先 preview，再由用户确认。
L4：涉及资金、权限、合同、生产变更或不可逆动作，必须双确认或转人工。
任意等级：工具返回 policy_denied、stale_data、conflict 时不得自行编造结果。

9.6 Agent loop 与状态控制

def run_domain_agent(task):
    state = init_state(task)
    state.intent = classify_intent(task.message)
    state.risk = classify_risk(state.intent, task.resource_scope)
    allowed_tools = policy.allowed_tools(task.user, state.risk)
    evidence = collect_evidence(task, allowed_tools)
    if not evidence.sufficient and state.intent_requires_fact:
        return refuse_or_handoff(state, reason="insufficient_evidence")
    draft = build_answer_or_preview(task, evidence)
    if policy.requires_approval(state.risk, draft.action):
        approval = request_human_confirmation(draft)
        if not approval.approved:
            return close_with_revision(state, approval.reason)
    result = execute_if_needed(draft, approval_token=approval.token)
    trace.write(state, evidence, draft, result)
    return format_user_response(result, evidence)

状态对象至少包含：

intent：当前业务意图，不允许在同一轮静默切换到更高风险动作。
risk_level：由工具、数据域、动作类型共同决定，不只看用户话术。
evidence_set：支持结论的文档、业务对象、时间戳和版本。
approval_state：not_required、pending、approved、rejected。
cost_budget：本轮最大模型调用、检索次数、工具调用次数和超时。

9.7 失败模式与恢复

失败模式	识别信号	恢复动作	验收标准
意图误判	用户纠正、工具类型不匹配	重新确认任务和范围	二次确认后不执行旧计划
权限越界	ACL 拒绝、资源不属于用户	解释权限边界并转人工	不泄露资源是否存在的敏感细节
证据不足	检索低分、版本过期	拒答、请求补充、创建知识缺口	无来源问题拒答率达标
工具失败	超时、冲突、幂等重复	指数退避、查询状态、人工接管	重试不产生重复写入
成本失控	多轮循环、检索过宽	收窄问题、停止循环、提示人工	单任务成本低于预算上限
错误承诺	输出含政策外承诺	模板拦截、质检召回	高风险承诺 0 容忍

9.8 评测数据集与验收阈值

评测样本建议按 JSONL 保存：

{"id":"personal_assistant_001","intent":"read","input":"查询一个有权限的业务对象并给出依据","expected_tools":["personal_assistant.execute_or_preview"],"must_cite":true,"must_approve":false}
{"id":"personal_assistant_002","intent":"write","input":"对业务对象执行需要确认的更新","expected_tools":["personal_assistant.execute_or_preview"],"must_cite":true,"must_approve":true}
{"id":"personal_assistant_003","intent":"deny","input":"请求访问无权限或高风险数据","expected_outcome":"refuse_or_handoff","must_approve":false}

指标	MVP 阈值	生产阈值	备注
意图识别准确率	>= 85%	>= 93%	按高频任务加权
工具选择准确率	>= 85%	>= 95%	错调写工具按严重问题处理
引用/证据支持率	>= 90%	>= 98%	关键事实必须可追溯
越权拦截率	100%	100%	不接受灰度放宽
L3/L4 审批触发率	100%	100%	包含间接写入动作
用户一次解决率	建立基线	较基线提升 10%-20%	结合人工质检解释
单任务成本	建立 P50/P95	P95 低于预算	拆分模型、缓存、限流

9.9 上线分阶段路线

阶段	范围	自动化程度	放量条件	回滚条件
P0 影子模式	只读旁路，不影响用户	0% 自动执行	与人工结果对比达到阈值	关键指标无法稳定复现
P1 坐席/员工辅助	生成建议和预览	人工确认后执行	质检通过、投诉不升高	误导性建议连续出现
P2 低风险自动化	L0-L2 自动，L3 预览	小流量灰度	工具成功率和拒答率达标	工具错误或成本超预算
P3 业务闭环	部分 L3 自动、L4 审批	分业务线推广	有 owner、审计和回放	高风险事故或审计缺口

9.10 ROI 与成本控制

成本项	控制方法	观察指标
模型调用	意图路由用小模型，复杂推理再升级	每任务 token、P95 成本
检索	缓存热门问题、限制 top_k、按权限预过滤	检索耗时、无效 chunk 比例
工具调用	合并只读查询、写操作幂等、失败短路	工具成功率、重试次数
人工审核	只把 L3/L4 和低置信任务送审	审核量、通过率、返修率
质检	分层抽样，重点看高风险和失败任务	抽检覆盖率、严重问题数

ROI 计算不要只写“提升效率”，至少记录：

基线：人工处理量、平均处理时长、错误率、升级率、单位人力成本。
Agent 后：自动解决量、辅助节省时长、人工确认时长、模型和工具成本。
净收益：节省人力成本 + 错误减少收益 - 模型成本 - 工具成本 - 运营质检成本。
可信区间：至少按 4 周灰度数据评估，不用单日峰值作为结论。

9.11 安全与上线清单

已定义 L0-L4 风险等级，并把每个工具映射到风险等级。
已接入身份、租户、资源级 ACL，越权请求在工具层二次拦截。
所有写操作有 preview、approval、idempotency_key 和审计记录。
对外回复有引用、时间戳或业务对象版本，不输出内部隐含策略。
Prompt injection、越权访问、错误承诺、敏感信息泄露进入安全评测集。
Trace 可按任务、用户、工具、风险等级检索和回放。
灰度期间有人工接管按钮、熔断开关和 owner 值班机制。
成本预算、速率限制、缓存策略和异常告警已经配置。

9.12 反模式

先接写工具再补权限模型，容易把演示系统变成生产风险入口。
只用满意度评估 Agent，不评测越权、拒答、工具参数和证据支持。
让模型自己判断“是否需要审批”，而不是由策略引擎根据工具和数据域判断。
把业务系统错误直接贴给用户，泄露内部对象、SQL、栈信息或风控标签。
用单一大模型处理所有请求，导致成本、延迟和稳定性都不可控。

10. 权威资料

Google Workspace API docs: https://developers.google.com/workspace
Microsoft Graph documentation: https://learn.microsoft.com/graph/
OpenAI Agents SDK: https://platform.openai.com/docs/guides/agents-sdk/ （核对日期：2026-05-09）
OWASP Top 10 for LLM Applications: https://owasp.org/www-project-top-10-for-large-language-model-applications/ （核对日期：2026-05-09）

1. 需求边界​

2. 架构图​

3. 工具设计​

4. 数据流​

5. 权限模型​

6. 风险点​

7. 评测方案​

8. 上线清单​

9. 项目级设计补充​

9.1 业务目标与非目标​

9.2 用户旅程与验收点​

9.3 系统架构与边界​

9.4 数据模型与权限矩阵​

9.5 工具 schema 与执行策略​

9.6 Agent loop 与状态控制​

9.7 失败模式与恢复​

9.8 评测数据集与验收阈值​

9.9 上线分阶段路线​

9.10 ROI 与成本控制​

9.11 安全与上线清单​

9.12 反模式​

10. 权威资料​

1. 需求边界

2. 架构图

3. 工具设计

4. 数据流

5. 权限模型

6. 风险点

7. 评测方案

8. 上线清单

9. 项目级设计补充

9.1 业务目标与非目标

9.2 用户旅程与验收点

9.3 系统架构与边界

9.4 数据模型与权限矩阵

9.5 工具 schema 与执行策略

9.6 Agent loop 与状态控制

9.7 失败模式与恢复

9.8 评测数据集与验收阈值

9.9 上线分阶段路线

9.10 ROI 与成本控制

9.11 安全与上线清单

9.12 反模式

10. 权威资料