RAG 不是“接个向量库就完事”——四步流水线实战拆解

本期简介
本期我们从一次真实的“信贷政策问答Agent”翻车案例讲起，把RAG的四个核心步骤——Indexing、Retrieval、Augmentation、Generation——掰开揉碎，告诉你每一步的常见坑和关键决策点。

时间轴
00:00 一个让风控总监脸色变了的演示翻车现场

03:15 RAG是什么？开卷考试和闭卷考试的区别
06:40 四步流水线全景图：Indexing → Retrieval → Augmentation → Generation
09:20 ① Indexing：Chunk大小、重叠、元数据——错一个后面全错
14:50 ② Retrieval：五种典型检索失败原因（Embedding不匹配、Query-Document Gap、Chunk切坏了……）
22:30 ③ Augmentation：如何拼Prompt让LLM听话、不编造
28:10 ④ Generation：模型选择、引用策略、兜底方案
33:00 技术本质：RAG解决LLM的三大局限
36:30 RAG vs Fine-tuning vs Long Context：客户永恒的三选一
41:00 PM/交付人员为什么必须理解RAG流程？
45:20 质量评估：检索质量×生成质量=最终质量
50:10 优化路线图：从跑通基线到持续运维
55:40 进阶话题：HyDE、Self-RAG、Graph RAG等变体简介
60:00 一张图总结RAG核心流程

重点笔记

RAG是四步串行系统：前面任何一步出错，最终答案都错。
检索质量×生成质量=最终质量。两个因子都做到95%以上，用户体验才有可能接近90分。
常见误区：RAG不是“接个向量数据库”，Chunk策略、Embedding选型、元数据管理、更新策略每一步都要设计。
项目落地：RAG不是一次性交付，是持续运营的系统——文档更新、模型升级、用户反馈闭环缺一不可。