RAG 不是“接个向量库就完事”——四步流水线实战拆解

RAG 不是“接个向量库就完事”——四步流水线实战拆解

14分钟 ·
播放数0
·
评论数0

本期简介
本期我们从一次真实的“信贷政策问答Agent”翻车案例讲起,把RAG的四个核心步骤——Indexing、Retrieval、Augmentation、Generation——掰开揉碎,告诉你每一步的常见坑和关键决策点。

时间轴
00:00 一个让风控总监脸色变了的演示翻车现场


03:15 RAG是什么?开卷考试和闭卷考试的区别
06:40 四步流水线全景图:Indexing → Retrieval → Augmentation → Generation
09:20 ① Indexing:Chunk大小、重叠、元数据——错一个后面全错
14:50 ② Retrieval:五种典型检索失败原因(Embedding不匹配、Query-Document Gap、Chunk切坏了……)
22:30 ③ Augmentation:如何拼Prompt让LLM听话、不编造
28:10 ④ Generation:模型选择、引用策略、兜底方案
33:00 技术本质:RAG解决LLM的三大局限
36:30 RAG vs Fine-tuning vs Long Context:客户永恒的三选一
41:00 PM/交付人员为什么必须理解RAG流程?
45:20 质量评估:检索质量×生成质量=最终质量
50:10 优化路线图:从跑通基线到持续运维
55:40 进阶话题:HyDE、Self-RAG、Graph RAG等变体简介
60:00 一张图总结RAG核心流程

重点笔记

  • RAG是四步串行系统:前面任何一步出错,最终答案都错。

  • 检索质量×生成质量=最终质量。两个因子都做到95%以上,用户体验才有可能接近90分。

  • 常见误区:RAG不是“接个向量数据库”,Chunk策略、Embedding选型、元数据管理、更新策略每一步都要设计。

  • 项目落地:RAG不是一次性交付,是持续运营的系统——文档更新、模型升级、用户反馈闭环缺一不可。