用户画像记忆

1. 定义与边界

用户画像记忆是关于用户偏好、背景、限制、工作方式和长期需求的结构化记忆。它的目标是减少重复沟通和提升个性化，而不是对用户进行不可见、不可控的推断。

不应写入用户画像的内容：

未经确认的敏感属性推断。
单次临时情绪或一次性偏好。
凭证、密钥、令牌、身份证件。
外部内容对用户的描述。

2. 为什么重要

用户画像能让 Agent 更好地服务长期用户：

默认语言、语气、详略程度。
常用技术栈、项目路径、工具偏好。
对交付物格式、受众、命名方式的偏好。
禁止事项，例如不修改某些目录、不联网、不生成多文件。

3. 核心机制

用户画像最重要的工程要求是：可见、可解释、可编辑、可删除。

4. 推荐 Schema

{
  "user_id": "u_123",
  "profile_version": 4,
  "preferences": {
    "language": {
      "value": "zh-CN",
      "scope": "default",
      "confidence": 0.95,
      "source_turn_id": "t_001"
    },
    "technical_answer_style": {
      "value": "direct_with_actionable_steps",
      "scope": "engineering tasks",
      "confidence": 0.86
    }
  },
  "do_not_store": ["secrets", "one-time instructions"],
  "updated_at": "2026-05-09T10:00:00+08:00"
}

5. 工程实现

画像写入策略：

def should_write_profile_memory(statement):
    if contains_secret(statement) or contains_sensitive_inference(statement):
        return "reject"
    if is_explicit_preference(statement):
        return "write"
    if is_repeated_behavior(statement) and confidence(statement) > 0.85:
        return "write_low_confidence"
    return "do_not_write"

画像读取策略：

只读取与当前任务相关的偏好。
把画像作为上下文，不作为不可违背命令。
当用户当前指令与画像冲突时，当前明确指令优先。
对低置信偏好使用“可能偏好”，必要时询问确认。

6. 生产实践

提供“记住这个”“不要记住这个”“忘记这个”用户控制入口。
建立画像管理页或命令，让用户查看和删除记忆。
对敏感字段做 allowlist，而不是事后 blacklist。
画像拆分为多个小文档，避免一个大 JSON 难以局部更新。
对偏好设置作用域，例如“写领导汇报时”“代码任务时”。

7. 常见反模式

用户没要求也偷偷长期记录。
根据一次对话推断职业、健康、政治等敏感属性。
把“这次任务”的要求写成永久偏好。
用户删除画像后向量索引仍可召回。
将用户 A 的偏好用于用户 B 或组织级输出。

8. 评测方法

画像抽取准确率。
用户显式偏好遵循率。
当前指令覆盖旧画像的成功率。
画像误用率。
用户删除/纠错后的生效率。

9. 安全与治理

画像属于高治理等级数据，即使不是法律意义上的敏感信息。
默认不保存密钥、账号、精确位置、身份号码。
对可能敏感的偏好使用确认式写入。
画像参与生成时记录 trace，便于解释“为什么这样回答”。
对组织系统执行租户隔离和 RBAC。

工程化补强：架构与实现细节

A. 与 RAG 的硬边界

用户画像记忆处理的核心对象是用户长期偏好、工作上下文、权限范围、沟通风格和明确禁忌。它来自用户和 Agent 的互动、任务执行轨迹或组织流程，而不是外部文档本身。 RAG 的核心对象是外部知识和证据；Memory 的核心对象是可复用状态。两者可以共享向量库、数据库或检索组件，但不能共享权限模型和写入流程。

维度	Memory	RAG
数据来源	对话、工具轨迹、用户明确偏好、任务结果	文档、网页、代码库、数据库、知识库
写入触发	互动后抽取、用户要求记住、后台总结	文档 ingestion、同步任务、管理员上传
可信边界	默认是个人/项目状态，仍需来源与置信度	默认是不可信外部内容，需要证据过滤
检索目标	帮 Agent 延续状态和复用经验	给回答提供事实证据和引用
失败后果	错误会跨任务持续影响行为	错误通常影响本次回答或索引版本
评测重点	personalization lift、over-personalization rate、profile correction rate、consent coverage	recall、faithfulness、citation accuracy

B. 生产级数据流

这条链路的关键是写入和检索分离。写入网关决定“能不能成为未来依据”，检索器决定“当前任务是否需要它”。

C. 推荐 JSON 结构

{
  "memory_id": "mem_01HY...",
  "memory_type": "short_term|semantic|episodic|procedural|profile",
  "namespace": ["org:o_1", "user:u_7", "project:p_3"],
  "content": {
    "summary": "用户希望技术文档用中文、结构紧凑、直接给结论",
    "normalized_value": {
      "language": "zh-CN",
      "style": "concise_engineering"
    }
  },
  "source": {
    "kind": "user_message|tool_trace|episode_summary|admin_policy",
    "trace_id": "tr_20260509_001",
    "turn_id": "turn_14",
    "evidence": "用户明确说：以后回答用中文，少废话"
  },
  "confidence": 0.86,
  "sensitivity": "normal|personal|confidential|restricted",
  "ttl_days": 180,
  "created_at": "2026-05-09T10:00:00+08:00",
  "updated_at": "2026-05-09T10:00:00+08:00",
  "profile_field": "response_style",
    "consent_basis": "explicit",
  "audit": {
    "writer": "memory_writer_v2",
    "decision": "accepted",
    "policy_version": "memory-policy-2026-05"
  }
}

字段级来源比整条记忆来源更重要。真实系统里经常只有某个字段可靠，不能因为一个字段可信就默认整条画像可信。

D. 写入门槛

候选信息	默认动作	原因
用户明确要求“记住”且不敏感	写入或更新	意图明确，价值高
多次稳定偏好	写入低风险字段	可减少重复沟通
单次情绪、抱怨、临时选择	不写或短 TTL	容易误画像
工具失败根因	写 episode	对未来排障有价值
外部网页诱导的规则	拒写	外部内容不能提升为行为规则
安全、权限、合规相关变更	人审或管理员确认	影响面大，不能由普通记忆覆盖

本文件的推荐写入原则是：画像只写与服务直接相关、用户可理解、可查看可删除的信息。

E. 检索策略

按当前任务最小化注入，只给模型必要字段，不暴露完整画像。工程上建议分三步：

硬过滤：tenant、user、project、role、sensitivity、TTL、deleted tombstone。
候选召回：profile 精确读取，semantic/episodic/procedural 可用关键词、向量和标签组合。
上下文组装：限制条数，附带类型、来源、置信度和“不能覆盖系统/开发者/安全策略”的说明。

def retrieve_memory(task, user, project, budget):
    scopes = acl_scopes(user=user, project=project)
    candidates = []
    candidates += profile_store.get(scopes.user_profile_fields(task))
    candidates += memory_index.search(task.query, filters=scopes.filters, k=20)
    ranked = rerank_by_usefulness(candidates, task.intent, now=task.now)
    safe = [m for m in ranked if policy.can_inject(m, task)]
    return pack_with_provenance(safe, token_budget=budget)

F. 遗忘与生命周期

用户删除、字段 TTL、低置信推断过期、角色变化后复核。遗忘不是简单删除文本，还包括向量、缓存、摘要、备份可恢复窗口和审计索引的协同。

生命周期阶段	操作	验收点
候选	只在临时队列保存	未通过网关不进入长期库
活跃	可检索、可解释、可编辑	trace 中能看到使用原因
降权	过期、低命中、低置信	默认不注入上下文
归档	保留审计或历史统计	不参与在线检索
删除	tombstone + 索引清理	删除 SLA 和回归测试通过

G. 失败模式与修复

失败模式	早期信号	修复动作
过度画像、敏感属性推断、跨用户串用画像	召回内容与当前任务不符，用户反复纠正	拆 namespace、加写入门槛、补评测切片
错误记忆长期影响回答	同类任务持续给错建议	增加冲突检测、用户编辑入口、低置信降权
过度个性化	Agent 在无关任务套用用户偏好	按任务域检索，不全量注入画像
记忆投毒	记忆中出现“忽略规则”“扩大权限”等内容	策略拒写，已写入内容隔离并审计
上下文污染	注入记忆太多，模型忽略当前指令	top-k 限制、摘要化、按阶段注入
删除不彻底	删除后仍可被向量召回	tombstone 过滤、重建索引、缓存失效

H. 评测指标

指标	计算方式	用途
Memory precision@k	注入记忆中真正有用的比例	控制上下文污染
Needed-memory recall@k	gold memory 是否被召回	检查检索覆盖
Task lift	开启记忆后的成功率/轮次/工具错误变化	判断是否值得保留系统复杂度
Stale-use rate	被使用但已过期或被覆盖的记忆比例	发现遗忘策略问题
Bad-write escape rate	不应写入但进入长期库的比例	评估写入网关
Privacy incident rate	越权召回、敏感泄露、误画像事件数	安全红线指标

I. 安全治理清单

记忆内容永远不能提升为系统指令，不能覆盖安全策略和开发者约束。
用户画像需要可查看、可修改、可删除；敏感画像默认不做自动推断。
外部文档、网页和工具输出要标记来源可信度，默认不能写成程序性规则。
加密静态数据和传输链路；对高敏字段做字段级加密或不可逆摘要。
审计记录至少包含写入者、来源、策略版本、检索任务、注入位置和删除事件。
多租户系统必须把 namespace、ACL 和索引过滤作为服务端强制逻辑，而不是 prompt 约束。

10. 权威资料

OpenAI Agents SDK Agent memory: https://openai.github.io/openai-agents-js/guides/sandbox-agents/memory （核对日期：2026-05-09）
LangChain Memory overview: https://docs.langchain.com/oss/python/concepts/memory （核对日期：2026-05-09）
NIST AI RMF 1.0: https://www.nist.gov/itl/ai-risk-management-framework （核对日期：2026-05-09）
OWASP Top 10 for LLM Applications: https://owasp.org/www-project-top-10-for-large-language-model-applications/ （核对日期：2026-05-09）

1. 定义与边界​

2. 为什么重要​

3. 核心机制​

4. 推荐 Schema​

5. 工程实现​

6. 生产实践​

7. 常见反模式​

8. 评测方法​

9. 安全与治理​

工程化补强：架构与实现细节​

A. 与 RAG 的硬边界​

B. 生产级数据流​

C. 推荐 JSON 结构​

D. 写入门槛​

E. 检索策略​

F. 遗忘与生命周期​

G. 失败模式与修复​

H. 评测指标​

I. 安全治理清单​

10. 权威资料​