跳到主要内容

LlamaIndex

核对日期:2026-05-09。

10.10 上线验收补充

验收项通过标准
入库治理source_id、owner、ACL、时间戳和版本齐全
检索评测recall@k、引用准确率和拒答正确率达标
权限检索前过滤,跨租户文档不可召回
注入防护恶意文档只作为数据,不驱动工具调用
数据删除删除请求能从索引、缓存和引用中清理
证据回放每个答案能回到检索片段和索引版本

1. 定义与边界

LlamaIndex 是以数据连接、索引、检索增强生成(RAG)和知识型 Agent 为核心的 LLM 应用框架。它适合把企业数据、文档、数据库和工具接入 Agent,不应被理解为只做向量数据库封装。

2. 官方能力、社区能力、实验能力和营销说法

类型内容
官方能力readers/connectors、index、retriever、query engine、agent、workflow、observability 集成
社区能力第三方数据源 reader、向量库、工具和模板
实验/快速变化工作流、Agent API、部分云服务和集成
营销说法“接入企业知识库即可避免幻觉”不成立,仍需检索评测和引用校验

3. 核心机制

LlamaIndex 的优势是围绕数据管道和 RAG 组织 Agent,而不是只让模型自由调用工具。

4. 架构与工程实现

适合场景:

场景设计
企业文档问答ingestion + index + retriever + citation
数据分析 Agentdatabase/tool + query planning
多知识源整合router retriever 或 query engine
数据驱动 workflowLlamaIndex workflow 管理步骤

数据节点建议保留元数据:

{
"doc_id": "hr-policy-2026",
"chunk_id": "hr-policy-2026#12",
"source": "confluence",
"acl": ["hr", "manager"],
"updated_at": "2026-05-01",
"text": "..."
}

5. 生产实践

  • ingestion、chunking、embedding、reranking 和生成要分开评测。
  • 检索必须尊重 ACL,不能让向量相似度绕过权限。
  • 对索引增量更新和删除做一致性检查。
  • 输出需要引用来源,并在证据不足时拒答或请求补充。
  • 对 reader 和 connector 做供应链审查。

6. 常见反模式

反模式后果
默认 chunking 上生产关键上下文被切断
只看答案流畅度检索失败被模型掩盖
忽略文档时间戳使用过期政策
无 ACL 过滤跨租户或跨部门泄漏

7. 评测方法

RAG/Agent 评测应拆为检索召回率、重排质量、引用准确率、答案 groundedness、拒答正确率和端到端成功率。建议维护包含冲突文档、过期文档和权限边界的数据集。

8. 安全与治理

主要风险是敏感文档进入错误上下文、外部文档注入、引用伪造和数据源凭证泄露。治理措施包括 ACL 前置过滤、source metadata、工具最小权限和审计。

9. 权威资料

10. 二次精修:数据型 Agent 决策材料

10.1 当前官方能力

能力作用决策含义
Data connectors / readers接入文件、数据库、SaaS、网页适合数据源多的 RAG
Index / retriever / query engine建索引、检索、问答适合知识库和搜索增强
Agents用工具和数据源完成任务适合数据密集型 Agent
Workflows事件驱动、可组合流程适合把 RAG 与工具流程编排
Evaluation / observability评测检索和生成质量适合建立 RAG 回归集

10.2 适用场景

场景推荐原因
企业文档问答数据接入、索引和检索能力完整
研究/分析 Agent多数据源、多步骤查询、引用追踪
需要对 RAG 质量细粒度调优检索、重排、评测组件清晰
要把数据管道和 Agent 合并workflows 可组织数据处理链路

10.3 不适用场景

  • 主要是业务写操作、审批和状态机,不是数据检索,优先工作流/图框架。
  • 数据权限非常复杂但无法在检索前过滤,任何 RAG 框架都不应直接接入。
  • 极简工具调用或纯聊天应用,LlamaIndex 可能过重。

10.4 数据流架构

10.5 生产实践

  • 文档入库时保留 source_idownertenantacleffective_atexpires_at
  • 检索前做权限过滤,不要检索后再让模型“不要看无权限内容”。
  • 对切分、embedding、rerank、top_k、引用规则建立版本。
  • 对过期文档、冲突文档和低可信来源建立降权或拒答策略。
  • 数据源凭证由连接器代理,不进入 prompt 和日志。

10.6 评测矩阵

评测项指标
检索recall@k、MRR、权限过滤正确率
生成groundedness、引用准确率、拒答正确率
数据治理过期文档命中率、跨租户泄露率
Agent工具选择准确率、多跳任务成功率
安全注入文档成功率、敏感字段外发率

10.7 反模式补充

反模式后果
只调 top_k 直到答案看起来好成本上升且可能引入噪声
不保存检索证据无法解释错误答案
文档入库无 owner 和 ACL无法满足企业权限和删除请求
用 RAG 替代数据权限系统跨租户泄露风险

10.8 集成边界

边界建议
与 LangGraphLlamaIndex 负责数据检索,LangGraph 负责长流程状态
与业务数据库读操作通过受控查询层,写操作走业务 API
与低代码平台平台可做入口,索引和评测仍需工程化管理
与安全系统接入 DLP、ACL、审计和数据保留策略

10.9 迁移策略

  • 从传统搜索迁移:先并行评测检索召回,再接入生成回答。
  • 从简单 RAG 迁移:先补 metadata 和 eval,再替换索引/检索组件。
  • 从 LangChain 迁移:保留业务工具,逐步把数据接入和 query engine 迁到 LlamaIndex。

核对日期:2026-05-09。