企业合规
企业合规是把 Agent 系统纳入组织级风险管理:明确用途、数据、权限、供应商、评测、人工监督、事件响应和责任归属。它不等于“写一份 AI 政策”,而是把 NIST AI RMF、ISO/IEC 42001、隐私、安全、行业监管和内部控制落到工程流程。
核对日期:2026-05-09。
9.7 合规验收补充
| 验收项 | 通过标准 |
|---|---|
| 风险台账 | 每个高风险 Agent 有 owner、风险等级、缓解措施和接受人 |
| 供应商 | 模型、插件、MCP Server、云服务都有数据处理和安全评估记录 |
| 用户权利 | 删除、导出、申诉、人工复核流程明确 |
| 变更复评 | 模型、prompt、工具、数据源变更触发重新评测 |
| 事故材料 | 审计、通知、回滚和复盘模板可直接使用 |
1. 定义与边界
Agent 合规需要覆盖三个层次:
| 层次 | 重点 |
|---|---|
| 系统合规 | 数据保护、身份权限、安全控制、日志、应急、供应商。 |
| AI 风险管理 | 有效性、可靠性、透明度、偏见、可解释性、人类监督。 |
| 业务合规 | 行业监管、客户合同、跨境、保留期、审计和问责。 |
合规不是上线后的文档补丁。高风险 Agent 应在设计阶段完成风险分级和控制映射。
2. 权威框架
| 框架 | 适用方式 |
|---|---|
| NIST AI RMF | 用 Govern、Map、Measure、Manage 组织 AI 风险管理流程。 |
| NIST AI 600-1 GenAI Profile | 针对生成式 AI 的风险分类和控制建议。 |
| ISO/IEC 42001 | 建立 AI 管理体系,适合组织级制度、角色和持续改进。 |
| EU AI Act | 对欧盟相关高风险 AI 用途、透明度和治理义务做映射。 |
| OWASP LLM Top 10 | 作为 LLM/Agent 应用安全风险清单。 |
| 云厂商安全基线 | 映射身份、网络、日志、密钥、数据保护和运行安全。 |
3. 风险分级
建议按以下因素分级:
| 因素 | 低风险 | 高风险 |
|---|---|---|
| 数据 | 公开资料 | PII、商业机密、受监管数据 |
| 工具 | 只读、无外部副作用 | 写入、删除、发外部消息、交易 |
| 用户 | 内部小范围试点 | 大规模客户或公众用户 |
| 业务影响 | 建议性辅助 | 自动决策、合同、财务、安全操作 |
| 可逆性 | 容易回滚 | 不可逆或外部可见 |
| 监管 | 无特殊要求 | 金融、医疗、教育、就业、公共服务 |
4. 控制映射
| 风险 | 工程控制 | 治理控制 |
|---|---|---|
| Prompt Injection | 上下文隔离、策略引擎、工具审批 | 红队、回归集、发布门禁 |
| 数据外泄 | 数据分类、DLP、最小上下文、日志脱敏 | 隐私评估、供应商数据条款 |
| 过度自主 | 工具分级、权限最小化、人类审批 | 用途审批、风险接受记录 |
| 不可解释 | trace、审计日志、版本化 | 用户申诉、内部审计 |
| 模型质量漂移 | 离线评测、线上监控、回滚 | 变更管理、定期复核 |
| 供应链风险 | 连接器审查、MCP allowlist、依赖扫描 | 供应商评估、合同控制 |
5. 生产流程
5.1 上线前
- 用途说明:Agent 做什么、不做什么、目标用户是谁。
- 数据清单:输入、输出、训练或日志保留、第三方流转、数据分类。
- 工具清单:工具权限、外部副作用、审批规则、owner。
- 风险评估:按数据、工具、用户、业务影响、监管分级。
- 安全评测:提示注入、数据外泄、越权、投毒、沙箱、审批绕过。
- 合规评审:隐私、法务、安全、业务 owner 签字或记录风险接受。
5.2 上线后
- 定期复评模型、Prompt、工具、数据源和供应商。
- 对高风险事件建立工单、SLA 和复盘流程。
- 用户反馈、投诉和申诉进入治理流程。
- 权限、日志、数据保留和删除请求定期抽检。
- 对重大变更重新评估风险,而不是只走代码发布。
6. 常见反模式
| 反模式 | 问题 |
|---|---|
| 把所有 Agent 都按同一风险处理 | 低风险过度治理,高风险控制不足。 |
| 合规只审 UI,不审工具和数据流 | Agent 的真实风险在后端数据和副作用。 |
| 没有系统 owner | 事故时无人能解释和关闭系统。 |
| 第三方模型和插件未做数据条款评估 | 可能违反客户合同、隐私或数据驻留要求。 |
| 模型升级不重新评测 | 行为改变可能影响安全和业务合规。 |
7. 评测与演练
| 检查 | 证据 |
|---|---|
| 风险分级存在 | 风险评估表、owner、审批记录。 |
| 数据流清晰 | 数据清单、DLP 策略、供应商条款。 |
| 人类监督有效 | 审批日志、抽检记录、拒绝原因。 |
| 安全评测通过 | 红队报告、回归集结果、修复记录。 |
| 事故可响应 | 演练记录、告警、回放、回滚和通知流程。 |
指标:
- 高风险 Agent 完成风险评估比例。
- 供应商安全评估覆盖率。
- 模型/工具重大变更重新评测比例。
- 数据删除请求按时完成率。
- 安全与合规问题修复 SLA。
8. 权威资料
- NIST AI Risk Management Framework: https://www.nist.gov/itl/ai-risk-management-framework
- NIST AI 600-1 Generative AI Profile: https://www.nist.gov/publications/artificial-intelligence-risk-management-framework-generative-artificial-intelligence
- ISO/IEC 42001 AI management system: https://www.iso.org/standard/81230.html
- EU Artificial Intelligence Act, Regulation (EU) 2024/1689: https://eur-lex.europa.eu/eli/reg/2024/1689/oj
- OWASP Top 10 for LLM Applications 2025: https://owasp.org/www-project-top-10-for-large-language-model-applications/
- Google Secure AI Framework: https://saif.google/
- Microsoft Azure OpenAI security baseline: https://learn.microsoft.com/en-us/security/benchmark/azure/baselines/azure-openai-security-baseline
- AWS Agentic AI Security Controls: https://docs.aws.amazon.com/prescriptive-guidance/latest/agentic-ai-security/introduction.html
9. 二次精修:合规到工程控制的映射
9.1 NIST AI RMF 落地表
| RMF 动作 | Agent 工程动作 | 证据 |
|---|---|---|
| Govern | 明确负责人、风险接受流程、供应商评审、变更管理 | RACI、风险台账、评审记录 |
| Map | 识别场景、用户、数据、工具、副作用和受影响群体 | 资产清单、数据流图、威胁模型 |
| Measure | 评测任务成功率、安全失败率、偏差、隐私和鲁棒性 | Eval 报告、红队报告、在线监控 |
| Manage | 限权、审批、沙箱、告警、事故响应和持续改进 | 策略配置、Runbook、复盘 |
9.2 常见监管关注点
| 关注点 | Agent 风险 | 控制 |
|---|---|---|
| 数据最小化 | 把整库数据放入上下文或日志 | 字段级裁剪、检索 ACL、日志脱敏 |
| 可解释与可追溯 | 无法解释 Agent 为什么执行动作 | trace、审计、版本化策略 |
| 第三方处理 | 模型供应商、插件、MCP Server 接触数据 | DPA、供应商评估、数据处理区域 |
| 人类监督 | Agent 自动执行高风险决定 | HITL、审批、申诉和人工兜底 |
| 安全性 | prompt injection、外泄、越权和供应链 | 红队、最小权限、沙箱、DLP |
9.3 合规包目录建议
compliance-pack/
ai-system-card.md
data-flow-diagram.md
risk-register.xlsx
model-and-tool-inventory.md
eval-report/
red-team-report/
incident-runbook.md
vendor-assessment/
policy-versions/
user-notice-and-human-review.md
9.4 上线评审流程
9.5 不适用与反模式
| 做法 | 问题 |
|---|---|
| 把合规当成上线后的文档补齐 | 高风险设计一旦上线,很难补救 |
| 只评估模型供应商,不评估工具和插件 | Agent 风险常出在工具副作用和数据连接器 |
| 所有场景套同一审批 | 低风险拖慢效率,高风险仍可能不足 |
| 不记录风险接受人 | 事故后责任与整改边界不清 |
9.6 复评触发器
- 模型、框架、MCP Server、工具 schema 或系统 prompt 发生重大变化。
- 数据范围从公开/内部扩展到客户、财务、身份、医疗、代码仓库等敏感数据。
- Agent 从只读变成写操作,或从内部用户开放到外部客户。
- 线上出现外泄、越权、错误自动化操作、歧视性结果或重大投诉。
核对日期:2026-05-09。