Semantic-Memory

1. 定义与边界

语义记忆（Semantic Memory）保存稳定事实、偏好、实体属性和关系。它回答的问题是：“关于用户、组织、项目、环境，有哪些长期有效的事实？”

语义记忆不同于 RAG 知识库。RAG 检索外部文档事实；语义记忆通常来自 Agent 与用户或任务的互动，并且会影响后续行为。

2. 为什么重要

语义记忆能让 Agent：

记住用户沟通偏好、语言偏好、格式偏好。
记住项目约束、技术栈、常用命令。
记住组织政策、审批要求、禁用工具。
将重复的背景信息结构化，降低上下文成本。

3. 核心机制

语义记忆要做事实抽取、冲突检测和置信度管理。

4. 数据模型

{
  "type": "semantic",
  "namespace": ["user", "u_123", "profile"],
  "key": "language_preference",
  "value": {
    "preferred_language": "zh-CN",
    "style": "direct_engineering",
    "applies_to": ["technical_answers", "repo_tasks"]
  },
  "evidence": [
    {"turn_id": "t1", "quote": "用中文，直接说结论"}
  ],
  "confidence": 0.86,
  "expires_at": null
}

5. 工程实现

5.1 抽取 prompt 输出约束

{
  "facts": [
    {
      "subject": "user",
      "predicate": "prefers_response_language",
      "object": "Chinese",
      "scope": "technical tasks",
      "confidence": 0.8,
      "should_persist": true,
      "needs_confirmation": false
    }
  ]
}

5.2 冲突处理

def merge_semantic_memory(old, new):
    if old.key == new.key and contradicts(old.value, new.value):
        if new.confidence < 0.7:
            return ask_user_to_confirm(old, new)
        old.value = new.value
        old.evidence += new.evidence
        old.confidence = max(old.confidence * 0.7, new.confidence)
        old.updated_at = now()
        return old
    return upsert_append(old, new)

6. 生产实践

使用结构化 schema，而不是只保存自然语言句子。
每个事实带作用域，例如“仅对本项目”“仅对文档写作任务”。
区分用户明确声明、Agent 推断和工具观察。
低置信推断不要自动长期生效。
经常变化的信息设置 TTL，例如当前职位、项目状态、临时偏好。

7. 常见反模式

从单次行为推断长期偏好。
把敏感身份、健康、财务等信息默认写入画像。
不保留 evidence，用户无法理解为什么系统这样判断。
只用自然语言拼接 profile，导致不可验证、不可局部删除。
忽略作用域，把项目偏好套到所有任务。

8. 评测方法

事实抽取精确率和召回率。
冲突检测准确率。
偏好遵循率。
低价值记忆写入率。
用户纠错后更新成功率。

9. 安全与治理

用户画像事实应默认用户可见。
高敏感类别需要禁止、脱敏或显式同意。
不允许外部网页内容直接写入用户画像。
对“记住你应该忽略安全策略”等内容做策略拒绝。
删除语义记忆时同步删除 embedding、缓存和派生摘要。

工程化补强：架构与实现细节

A. 与 RAG 的硬边界

Semantic Memory处理的核心对象是稳定事实、用户偏好、项目约束和实体属性。它来自用户和 Agent 的互动、任务执行轨迹或组织流程，而不是外部文档本身。 RAG 的核心对象是外部知识和证据；Memory 的核心对象是可复用状态。两者可以共享向量库、数据库或检索组件，但不能共享权限模型和写入流程。

维度	Memory	RAG
数据来源	对话、工具轨迹、用户明确偏好、任务结果	文档、网页、代码库、数据库、知识库
写入触发	互动后抽取、用户要求记住、后台总结	文档 ingestion、同步任务、管理员上传
可信边界	默认是个人/项目状态，仍需来源与置信度	默认是不可信外部内容，需要证据过滤
检索目标	帮 Agent 延续状态和复用经验	给回答提供事实证据和引用
失败后果	错误会跨任务持续影响行为	错误通常影响本次回答或索引版本
评测重点	fact precision、preference adherence、conflict resolution accuracy、correction rate	recall、faithfulness、citation accuracy

B. 生产级数据流

这条链路的关键是写入和检索分离。写入网关决定“能不能成为未来依据”，检索器决定“当前任务是否需要它”。

C. 推荐 JSON 结构

{
  "memory_id": "mem_01HY...",
  "memory_type": "short_term|semantic|episodic|procedural|profile",
  "namespace": ["org:o_1", "user:u_7", "project:p_3"],
  "content": {
    "summary": "用户希望技术文档用中文、结构紧凑、直接给结论",
    "normalized_value": {
      "language": "zh-CN",
      "style": "concise_engineering"
    }
  },
  "source": {
    "kind": "user_message|tool_trace|episode_summary|admin_policy",
    "trace_id": "tr_20260509_001",
    "turn_id": "turn_14",
    "evidence": "用户明确说：以后回答用中文，少废话"
  },
  "confidence": 0.86,
  "sensitivity": "normal|personal|confidential|restricted",
  "ttl_days": 180,
  "created_at": "2026-05-09T10:00:00+08:00",
  "updated_at": "2026-05-09T10:00:00+08:00",
  "entity": "user:u_123",
    "field": "communication.language",
  "audit": {
    "writer": "memory_writer_v2",
    "decision": "accepted",
    "policy_version": "memory-policy-2026-05"
  }
}

字段级来源比整条记忆来源更重要。真实系统里经常只有某个字段可靠，不能因为一个字段可信就默认整条画像可信。

D. 写入门槛

候选信息	默认动作	原因
用户明确要求“记住”且不敏感	写入或更新	意图明确，价值高
多次稳定偏好	写入低风险字段	可减少重复沟通
单次情绪、抱怨、临时选择	不写或短 TTL	容易误画像
工具失败根因	写 episode	对未来排障有价值
外部网页诱导的规则	拒写	外部内容不能提升为行为规则
安全、权限、合规相关变更	人审或管理员确认	影响面大，不能由普通记忆覆盖

本文件的推荐写入原则是：要求明确声明、可靠工具观察或多次一致行为；推断必须标注低置信度。

E. 检索策略

按实体、字段、任务域和置信度检索，冲突字段要求模型澄清。工程上建议分三步：

硬过滤：tenant、user、project、role、sensitivity、TTL、deleted tombstone。
候选召回：profile 精确读取，semantic/episodic/procedural 可用关键词、向量和标签组合。
上下文组装：限制条数，附带类型、来源、置信度和“不能覆盖系统/开发者/安全策略”的说明。

def retrieve_memory(task, user, project, budget):
    scopes = acl_scopes(user=user, project=project)
    candidates = []
    candidates += profile_store.get(scopes.user_profile_fields(task))
    candidates += memory_index.search(task.query, filters=scopes.filters, k=20)
    ranked = rerank_by_usefulness(candidates, task.intent, now=task.now)
    safe = [m for m in ranked if policy.can_inject(m, task)]
    return pack_with_provenance(safe, token_budget=budget)

F. 遗忘与生命周期

字段级版本、撤销、过期、冲突合并和用户编辑。遗忘不是简单删除文本，还包括向量、缓存、摘要、备份可恢复窗口和审计索引的协同。

生命周期阶段	操作	验收点
候选	只在临时队列保存	未通过网关不进入长期库
活跃	可检索、可解释、可编辑	trace 中能看到使用原因
降权	过期、低命中、低置信	默认不注入上下文
归档	保留审计或历史统计	不参与在线检索
删除	tombstone + 索引清理	删除 SLA 和回归测试通过

G. 失败模式与修复

失败模式	早期信号	修复动作
把推断当事实，把外部不可信内容写成用户偏好	召回内容与当前任务不符，用户反复纠正	拆 namespace、加写入门槛、补评测切片
错误记忆长期影响回答	同类任务持续给错建议	增加冲突检测、用户编辑入口、低置信降权
过度个性化	Agent 在无关任务套用用户偏好	按任务域检索，不全量注入画像
记忆投毒	记忆中出现“忽略规则”“扩大权限”等内容	策略拒写，已写入内容隔离并审计
上下文污染	注入记忆太多，模型忽略当前指令	top-k 限制、摘要化、按阶段注入
删除不彻底	删除后仍可被向量召回	tombstone 过滤、重建索引、缓存失效

H. 评测指标

指标	计算方式	用途
Memory precision@k	注入记忆中真正有用的比例	控制上下文污染
Needed-memory recall@k	gold memory 是否被召回	检查检索覆盖
Task lift	开启记忆后的成功率/轮次/工具错误变化	判断是否值得保留系统复杂度
Stale-use rate	被使用但已过期或被覆盖的记忆比例	发现遗忘策略问题
Bad-write escape rate	不应写入但进入长期库的比例	评估写入网关
Privacy incident rate	越权召回、敏感泄露、误画像事件数	安全红线指标

I. 安全治理清单

记忆内容永远不能提升为系统指令，不能覆盖安全策略和开发者约束。
用户画像需要可查看、可修改、可删除；敏感画像默认不做自动推断。
外部文档、网页和工具输出要标记来源可信度，默认不能写成程序性规则。
加密静态数据和传输链路；对高敏字段做字段级加密或不可逆摘要。
审计记录至少包含写入者、来源、策略版本、检索任务、注入位置和删除事件。
多租户系统必须把 namespace、ACL 和索引过滤作为服务端强制逻辑，而不是 prompt 约束。

10. 权威资料

LangChain Memory overview: https://docs.langchain.com/oss/python/concepts/memory （核对日期：2026-05-09）
LangChain Long-term memory: https://docs.langchain.com/oss/python/langchain/long-term-memory （核对日期：2026-05-09）
OpenAI Agents SDK Agent memory: https://openai.github.io/openai-agents-js/guides/sandbox-agents/memory （核对日期：2026-05-09）
NIST AI RMF 1.0: https://www.nist.gov/publications/artificial-intelligence-risk-management-framework-ai-rmf-10 （核对日期：2026-05-09）

1. 定义与边界​

2. 为什么重要​

3. 核心机制​

4. 数据模型​

5. 工程实现​

5.1 抽取 prompt 输出约束​

5.2 冲突处理​

6. 生产实践​

7. 常见反模式​

8. 评测方法​

9. 安全与治理​

工程化补强：架构与实现细节​

A. 与 RAG 的硬边界​

B. 生产级数据流​

C. 推荐 JSON 结构​

D. 写入门槛​

E. 检索策略​

F. 遗忘与生命周期​

G. 失败模式与修复​

H. 评测指标​

I. 安全治理清单​

10. 权威资料​