LlamaIndex · Data Framework for LLMs · Python + TS

LlamaIndex 数据框架实战

LLM 时代最成熟的数据层框架。LangChain 做 orchestration,LlamaIndex 做 data——把你的 PDF/数据库/Notion/API 里那些"杂乱的私有数据"转成 LLM 能用的上下文。Document → Node → Index → Retriever → Query Engine → Agent,一条流水线讲清楚 RAG 的每一步。

12 章 · 从 5 行 Hello RAG 到生产 Agent · Python 优先 · 300+ 数据连接器

为什么单独讲 LlamaIndex

RAG 看起来简单:"切块 + 向量化 + 检索 + 喂给 LLM",但做到好用要踩太多坑——chunk_size 几多才合理?PDF 里的表格怎么不丢结构?多文件时要不要建层级索引?重排到底有没有用?生产该选什么 vector store?这些全是数据问题,不是 LLM 问题。

LlamaIndex 在 2022 年 GPT Index 时代就专注这一层,如今是 RAG 生态事实标准。12 章带你从 5 行 Hello RAG 跑到生产级 Agentic RAG——每一步都对比方案优劣,教你在业务里做决策,不只是复制文档。

01

LlamaIndex 是什么 · 为何是它

LlamaIndex vs LangChain vs Haystack · 数据框架 vs orchestration · RAG 全景 · 五行 Hello RAG · 2026 最新生态位

入门对比RAG 全景
02

Document 与 Node · 数据的原子

Document 是啥 · Node 为什么要切 · metadata 怎么带 · relationships 节点关系 · TextNode/ImageNode/IndexNode 三类 · 手工构造 vs 自动切片

DocumentNodemetadata
03

数据连接器 · LlamaHub 300+ 来源

SimpleDirectoryReader 基础 · LlamaParse 解析 PDF 表格/公式 · Notion/Slack/Confluence 连接器 · SQLDatabaseReader · 定制 Reader · 去重和增量更新

LlamaHubLlamaParse连接器
04

Ingestion Pipeline · 切块与嵌入

Splitter 选型(Sentence/Token/Semantic/Markdown) · chunk_size/overlap 到底怎么选 · Embedding 模型选择 · BGE/M3/Jina 实战对比 · IngestionPipeline 缓存 · 增量索引

SplitterEmbeddingPipeline
05

Index 家族 · 选对你的索引

VectorStoreIndex 主力 · SummaryIndex 层级摘要 · KeywordTableIndex 反向索引 · KnowledgeGraphIndex 知识图谱 · ComposableGraph 混合 · 场景对号入座

VectorStoreSummaryKG
06

Vector Store · 从 SimpleVectorStore 到 Qdrant

默认本地内存 · Qdrant/Weaviate/Milvus/pgvector/Chroma 六大方案实测 · 持久化 StorageContext · MetadataFilters 过滤 · hybrid search 稀疏+稠密 · 生产选型

QdrantpgvectorHybrid
07

Retriever 与 Query Engine · 检索的精细控制

Retriever vs QueryEngine · top_k / similarity_cutoff · AutoRetriever 结构化过滤 · RecursiveRetriever 多跳 · Postprocessor 后处理 · Cohere/BGE 重排 · RouterQueryEngine 多库分发

RetrieverRerankRouter
08

查询变换与高级 RAG · HyDE/多查询/子问题

HyDE 假设文档 · QueryTransform · MultiStepQueryEngine 分步 · SubQuestionQueryEngine 拆问题 · Self-RAG 自反思 · GraphRAG 图增强 · 评估各自适用场景

HyDESubQSelf-RAG
09

Agent · 工具调用 + ReAct + 多 Agent

FunctionAgent / ReActAgent 两种内核 · Tool 注册和自描述 · AgentWorkflow 多 Agent 编排 · 记忆与状态 · RAG 和 Agent 的融合点 · Chat Engine 进阶

AgentReActTools
10

Workflow · 事件驱动的复杂流程

Workflow 是什么 · @step 装饰器 · StartEvent/StopEvent/自定义 Event · 并行分支与汇流 · Context 状态共享 · HITL 人工介入 · 可视化 · 对标 LangGraph

WorkflowEventDAG
11

评估与观测 · RAG 质量不能靠感觉

Faithfulness/Relevancy/Correctness 三大指标 · LlamaIndex 内置 Evaluator · RAGAs/TruLens 对接 · 黄金集构建 · 在线 A/B · Arize Phoenix / OpenLLMetry 接观测

EvalRAGAsPhoenix
12

生产部署 · FastAPI/llama_deploy/缓存/上线清单

StorageContext 持久化策略 · FastAPI 模板 · llama_deploy 微服务化 · 流式 SSE · 缓存层(响应/嵌入/检索) · 成本控制 · Docker + K8s · 上线 20 条 checklist

FastAPIllama_deployproduction