AI产品与业务落地

核对日期：2026-05-13。

不稳定项：模型价格、企业采购政策、行业监管、AI 办公套件能力、SaaS 产品形态、数据合规要求和用户对 AI 的接受度变化较快；立项和采购前必须重新核对供应商条款、公司安全要求和适用法规。

1. 阶段目标

本阶段目标是把技术能力转化为可采用、可验证、可治理的业务成果。AI 产品落地不是把模型接进产品，也不是做一个漂亮 demo，而是把 AI 能力嵌入真实工作流，并用明确指标证明它提升了效率、质量、收入或风险控制能力。

学完本阶段，你应该能做到：

从业务流程中筛选适合 AI 的高价值场景。
判断一个场景适合规则、传统 ML、RAG、Workflow、Agent 还是人工流程。
设计 AI 产品 MVP，明确不做什么。
计算 ROI：节省时间、提升质量、降低错误、增加收入和控制风险。
设计 AI 产品体验：可编辑、可确认、可追溯、可回退、可反馈。
评估 Build vs Buy：自研、采购 SaaS、使用平台、开源部署或混合方案。
制定试点、灰度、培训、运营和治理计划。
设计业务验收标准，避免“看起来聪明但没人用”。

本阶段的核心产出是：

一份 AI 产品立项方案。
一个场景优先级评分表。
一个 ROI 测算模型。
一个 MVP 范围和试点计划。
一份供应商/自研决策表。

2. 学习前置条件

建议已完成：

08-AI应用工程，理解模型接入、前端体验和成本账本。
09-Agent系统设计，理解 Agent 适用边界和工具风险。
10-评测体系，能定义任务级验收指标。
11-安全与治理，理解数据、权限、审计和供应商风险。
12-LLMOps与生产化，理解灰度、回滚、成本和生产运营。

不要求：

成为产品经理或咨询顾问。
一开始就能做企业级 AI 平台战略。
把所有 AI 项目都量化成精确财务模型。

3. 核心知识地图

4. 详细讲义

4.1 AI 落地的基本判断

一个值得做的 AI 场景通常满足：

高频：每天或每周发生，能形成规模价值。
非结构化：涉及文本、文档、代码、图像、对话等。
可验证：输出能被用户、规则、证据或评测集验证。
可控风险：错误可发现、可撤销、可人工复核。
数据可得：有样例、文档、历史记录或业务系统。
工作流明确：知道 AI 输出会被谁使用、如何使用。

不适合优先做的场景：

只是为了展示 AI。
成功标准模糊。
低频且价值低。
错误不可逆。
数据无法访问或质量很差。
用户没有动力改变流程。

4.2 场景筛选矩阵

用 5 个维度给场景打分，每项 1-5 分：

维度	高分特征	低分特征
业务价值	节省大量时间、减少重大损失、提升收入	只是体验新奇
发生频率	高频重复	偶发低频
技术可行性	输入输出清晰，有数据和证据	目标开放且不可验证
风险可控	可人工确认、可回滚	错误不可逆
组织可采用	已有流程入口和负责人	无 owner，无流程

优先级公式示例：

priority = business_value * frequency * feasibility * adoption / risk

风险不是越低越好。高风险高价值场景也可以做，但必须增加审批、评测和治理成本。

4.3 AI 方案选择：不要默认上 Agent

问题类型	推荐方案	不建议
明确规则判断	规则/配置	LLM 自由判断
表格预测	传统 ML	直接聊天问模型
文档问答	RAG	只靠模型参数记忆
固定多步骤流程	Workflow	自主 Agent
开放多步研究	Agent 或半自动 workflow	单次 Prompt
高风险写操作	AI 草稿 + 人工审批	全自动执行

产品判断：AI 能力应该服务任务，不应该成为架构炫技。

4.4 从流程图开始，而不是从模型开始

落地前先画当前流程：

谁发起任务
-> 输入是什么
-> 当前如何处理
-> 哪一步最慢/最容易错
-> 谁审核
-> 结果进入哪个系统
-> 失败如何处理

然后标出 AI 可介入的位置：

前置理解：分类、路由、意图识别。
信息收集：检索、摘要、抽取。
草稿生成：回复、报告、代码、文案。
审查辅助：风险提示、对比、校验。
决策支持：解释数据和建议。
自动执行：仅限低风险或经过审批的动作。

4.5 MVP 范围设计

AI MVP 的目标是验证核心假设，而不是一次性做完整平台。

MVP 必须回答：

目标用户是谁。
具体任务是什么。
AI 输出如何被使用。
成功指标是什么。
哪些风险必须拦住。
哪些能力暂时不做。

好的 MVP：

场景窄。
数据真实。
有人工兜底。
有评测集。
有用户反馈入口。
有成本和延迟记录。

坏的 MVP：

做通用聊天助手。
没有明确业务流程。
没有验收指标。
只做演示，不处理失败。

4.6 AI 产品体验原则

AI 产品体验的核心是让用户保持控制权。

原则	说明
可编辑	AI 生成草稿，用户能修改
可确认	高风险动作必须确认
可追溯	关键结论有来源或证据
可回退	错误结果可撤销或重做
可解释	告诉用户依据和限制
可反馈	用户能标记好坏和错误
可接管	需要时转人工

AI 输出不要假装确定。对不确定内容要展示置信度、引用、缺失信息或建议下一步。

4.7 ROI 测算

ROI 不只看节省人力。常见收益：

节省时间。
提升处理量。
降低错误率。
提升响应速度。
提高转化率。
降低培训成本。
改善知识复用。
降低合规风险。

成本包括：

模型 token 成本。
开发成本。
数据整理成本。
评测和标注成本。
安全和合规成本。
运维和监控成本。
用户培训和变更管理成本。
人工复核成本。

简化公式：

月收益 = 月任务量 * 单次节省时间 * 人力成本 * 采纳率
      + 错误减少带来的收益
      + 收入提升

月成本 = 模型成本 + 工程运维 + 人工复核 + 培训治理

ROI = (月收益 - 月成本) / 月成本

注意：很多 AI 项目前期 ROI 不确定，应先用试点验证关键假设。

4.8 业务指标设计

指标要同时覆盖效率、质量、采用和风险。

类别	指标
效率	平均处理时长、等待时间、吞吐量
质量	正确率、审核通过率、返工率
采用	DAU、使用率、采纳率、留存
体验	用户满意度、编辑距离、重新生成率
成本	token 成本、人工复核成本、单位任务成本
风险	安全拦截率、错误承诺率、越权尝试

不要只看调用量。调用量高可能是因为用户反复重试。

4.9 Build vs Buy

方案	优点	缺点	适用
采购 SaaS	上线快、能力完整	定制弱、数据和锁定风险	通用办公/客服/销售
使用云平台	基础能力强、合规选项多	成本和复杂度中等	企业级应用
自研应用	贴合流程、差异化强	工程和运维成本高	核心业务
开源自托管	控制强、可私有化	维护和安全责任大	数据敏感或定制强
混合方案	平衡速度和控制	架构复杂	多团队、多场景

判断问题：

这是核心差异化能力吗？
数据能否给第三方？
需要多深的流程集成？
供应商是否支持审计和权限？
成本随规模如何增长？
退出和迁移是否可行？

4.10 供应商评估

供应商评估维度：

模型能力和评测结果。
数据保留和训练政策。
安全认证和企业协议。
权限、审计和日志能力。
私有化或区域部署能力。
API 稳定性和 SLA。
价格透明度。
集成成本。
可导出数据。
退出方案。

采购前必须做小规模试点和安全评审。不要只看演示效果和报价。

4.11 组织落地

AI 落地经常卡在组织，而不是模型。

需要明确：

业务 owner。
产品 owner。
技术 owner。
安全/合规 reviewer。
一线用户代表。
运营和培训负责人。

推广步骤：

选场景
-> 小范围试点
-> 收集反馈和失败样例
-> 修复流程和产品
-> 培训关键用户
-> 灰度推广
-> 建立运营指标
-> 持续迭代

AI 工具改变人的工作方式，要给用户解释“为什么用、什么时候不用、出错怎么办”。

4.12 AI 产品治理

治理内容：

哪些场景允许使用 AI。
哪些数据不能进入模型。
哪些输出必须人工确认。
哪些模型和供应商可用。
Prompt 和评测如何管理。
日志和审计保留多久。
事故如何响应。
用户如何申诉和反馈。

治理不是阻止创新，而是让 AI 能持续上线和扩展。

4.13 从试点到规模化

试点成功不等于规模化成功。

规模化需要：

标准化 SDK 或平台。
可复用评测集。
成本预算。
用户培训材料。
安全和合规模板。
运营仪表盘。
支持流程。

从单点项目走向平台化时，要避免两个极端：

每个团队重复造轮子。
中央平台过度抽象，业务无法快速试错。

4.14 立项文档结构

5. 关键概念表

概念	含义	工程/业务意义	常见问题
Scenario fit	场景适配度	决定是否值得做 AI	为了 AI 而 AI
MVP	最小可验证产品	快速验证核心假设	范围过大
ROI	投入产出	判断是否持续投入	只算 token 成本
Adoption	用户采用	决定真实价值	只看调用量
Workflow integration	流程嵌入	让 AI 进入日常工作	做成孤立工具
Human confirmation	人工确认	控制风险	确认信息不足
Build vs Buy	自研/采购判断	平衡速度和控制	只看报价
Pilot	试点	降低不确定性	直接全量上线
Governance	治理	可持续规模化	上线后才补
Change management	变更管理	用户培训和流程调整	忽视组织阻力

6. 工程案例

6.1 AI 客服助手

目标：生成客服回复草稿，降低响应时间。

适合原因：

高频任务。
有知识库和历史工单。
输出可由客服确认。
可用采纳率和编辑距离评估。

MVP：

只支持 5 类高频问题。
只生成草稿，不自动发送。
必须显示引用和政策来源。

风险：

错误承诺赔付。
泄露用户隐私。
过度自动化导致客服不审查。

6.2 AI 代码 Review

目标：辅助发现 PR 风险。

适合原因：

输入结构化为 diff。
输出可由开发者判断。
可与 CI 结合。

MVP：

只做风险提示和测试建议。
不自动修改代码。
输出文件路径、问题、影响和建议。

指标：

有效问题命中率。
误报率。
开发者采纳率。
Review 时间变化。

6.3 AI 销售线索总结

目标：从通话记录、邮件和 CRM 中生成客户摘要。

适合原因：

非结构化信息多。
销售需要快速了解上下文。
输出可编辑。

风险：

编造客户承诺。
泄露敏感商业信息。
CRM 字段写入错误。

6.4 AI 内部知识库

目标：回答制度、流程和技术文档问题。

适合原因：

文档分散。
新人学习成本高。
答案需要引用。

MVP：

只接入审核过的文档。
支持拒答。
记录未命中问题。

6.5 AI 数据分析助手

目标：帮助业务人员查询指标和生成分析草稿。

适合原因：

用户有自然语言问题。
指标口径需要解释。
输出可以被分析师复核。

边界：

SQL 只读。
关键指标口径由系统提供。
不直接做财务决策。

7. 常见误区与反模式

反模式	表现	后果	修正
为 AI 而 AI	先选模型再找场景	用户不用	从流程痛点出发
Demo 即产品	演示好看但无失败处理	上线翻车	做评测和异常路径
只算模型成本	忽略标注、治理、培训	ROI 失真	全成本测算
忽略工作流	做成单独聊天窗口	使用率低	嵌入原系统
无 owner	技术团队自嗨	无法推广	明确业务 owner
直接全量上线	无试点和灰度	风险扩大	小范围试点
采购后不运营	买了工具没人用	浪费预算	培训、指标、治理
AI 直接替人决策	无确认和复核	合规风险	人类在环
不收集失败样例	问题反复出现	无法迭代	失败样例库

8. 阶段练习

8.1 场景打分

列出 5 个业务场景，按以下维度 1-5 分打分：

业务价值。
发生频率。
技术可行性。
风险可控性。
组织可采用性。

选出最适合做 MVP 的一个，并说明为什么。

8.2 MVP 范围

为一个 AI 产品写 MVP：

做什么。
不做什么。
输入输出。
用户流程。
成功指标。
风险边界。

8.3 ROI 测算

为一个场景估算：

月任务量。
单次节省时间。
人力成本。
采纳率。
模型成本。
人工复核成本。
预估 ROI。

8.4 Build vs Buy 决策

比较自研和采购：

上线速度。
数据安全。
定制能力。
长期成本。
供应商锁定。
退出方案。

8.5 试点计划

写一个 4 周试点计划：

第 1 周：场景和数据。
第 2 周：MVP 和评测。
第 3 周：小范围使用。
第 4 周：复盘和决策。

9. 项目任务

9.1 项目要求

完成一份 AI 产品立项方案。

必须包含：

用户和业务场景。
当前流程和痛点。
为什么适合 AI。
技术方案选择。
MVP 范围。
数据和权限边界。
评测集和业务指标。
ROI 测算。
Build vs Buy 分析。
试点和推广计划。
风险和治理方案。

9.2 立项方案模板

# AI 产品立项方案

## 1. 一句话结论
## 2. 用户和场景
## 3. 当前流程
## 4. 痛点和机会
## 5. AI 方案
## 6. MVP 范围和非目标
## 7. 技术和数据方案
## 8. 产品体验
## 9. 评测和业务指标
## 10. ROI 测算
## 11. Build vs Buy
## 12. 试点计划
## 13. 风险、治理和回滚

9.3 评分标准

维度	分值	标准
场景选择	20	高频、高价值、可验证、风险可控
产品设计	20	用户流程、确认、追溯、反馈清晰
技术判断	15	能合理选择 RAG、Workflow、Agent 或非 AI 方案
ROI	15	收益和全成本计算完整
落地计划	15	试点、灰度、培训和运营可执行
治理	15	数据、权限、安全、供应商和回滚清楚

10. 验收题

什么样的场景适合优先做 AI？
为什么 AI 产品要从业务流程图开始？
如何判断一个场景应该用规则、RAG、Workflow 还是 Agent？
AI 产品 MVP 应该包含哪些内容？
ROI 除了模型成本还要计算哪些成本？
为什么采用率比调用量更重要？
Build vs Buy 需要比较哪些维度？
AI 产品为什么需要可编辑、可确认和可回退？
试点成功为什么不等于规模化成功？
组织落地通常会遇到哪些阻力？

11. 延伸阅读

产品与落地资料

Google People + AI Guidebook: https://pair.withgoogle.com/guidebook/
OpenAI Business resources: https://openai.com/business/
NIST AI Risk Management Framework: https://www.nist.gov/itl/ai-risk-management-framework
OECD AI Principles: https://oecd.ai/en/ai-principles
ISO/IEC 42001 overview: https://www.iso.org/standard/81230.html

建议阅读方式

先读 Google People + AI Guidebook，建立人机协作产品体验视角。
再读 NIST AI RMF 和 OECD AI Principles，补足风险治理。
最后结合自己的业务流程写立项方案，不要只做技术 demo。

12. 本阶段总结

AI 产品落地的关键不是模型能力，而是场景选择、流程嵌入、用户控制、业务指标、组织采用和治理能力。一个好的 AI 产品让用户更快、更准、更可控地完成任务，而不是让用户猜模型到底能不能信。

你应该形成一个判断：AI 项目要先证明“值得做”，再证明“能做好”，最后证明“能持续运营”。下一阶段会进入综合实战项目，把前面所有能力整合成可展示、可评测、可复盘的作品集。

1. 阶段目标​

2. 学习前置条件​

3. 核心知识地图​

4. 详细讲义​

4.1 AI 落地的基本判断​

4.2 场景筛选矩阵​

4.3 AI 方案选择：不要默认上 Agent​

4.4 从流程图开始，而不是从模型开始​

4.5 MVP 范围设计​

4.6 AI 产品体验原则​

4.7 ROI 测算​

4.8 业务指标设计​

4.9 Build vs Buy​

4.10 供应商评估​

4.11 组织落地​

4.12 AI 产品治理​

4.13 从试点到规模化​

4.14 立项文档结构​

5. 关键概念表​

6. 工程案例​

6.1 AI 客服助手​

6.2 AI 代码 Review​

6.3 AI 销售线索总结​

6.4 AI 内部知识库​

6.5 AI 数据分析助手​

7. 常见误区与反模式​

8. 阶段练习​

8.1 场景打分​

8.2 MVP 范围​

8.3 ROI 测算​

8.4 Build vs Buy 决策​

8.5 试点计划​

9. 项目任务​

9.1 项目要求​

9.2 立项方案模板​

9.3 评分标准​

10. 验收题​

11. 延伸阅读​

产品与落地资料​

建议阅读方式​

12. 本阶段总结​

1. 阶段目标

2. 学习前置条件

3. 核心知识地图

4. 详细讲义

4.1 AI 落地的基本判断

4.2 场景筛选矩阵

4.3 AI 方案选择：不要默认上 Agent

4.4 从流程图开始，而不是从模型开始

4.5 MVP 范围设计

4.6 AI 产品体验原则

4.7 ROI 测算

4.8 业务指标设计

4.9 Build vs Buy

4.10 供应商评估

4.11 组织落地

4.12 AI 产品治理

4.13 从试点到规模化

4.14 立项文档结构

5. 关键概念表

6. 工程案例

6.1 AI 客服助手

6.2 AI 代码 Review

6.3 AI 销售线索总结

6.4 AI 内部知识库

6.5 AI 数据分析助手

7. 常见误区与反模式

8. 阶段练习

8.1 场景打分

8.2 MVP 范围

8.3 ROI 测算

8.4 Build vs Buy 决策

8.5 试点计划

9. 项目任务

9.1 项目要求

9.2 立项方案模板

9.3 评分标准

10. 验收题

11. 延伸阅读

产品与落地资料

建议阅读方式

12. 本阶段总结