本期简介
本期我们从一次真实的“信贷政策问答Agent”翻车案例讲起,把RAG的四个核心步骤——Indexing、Retrieval、Augmentation、Generation——掰开揉碎,告诉你每一步的常见坑和关键决策点。
时间轴
一个让风控总监脸色变了的演示翻车现场
RAG是什么?开卷考试和闭卷考试的区别
四步流水线全景图:Indexing → Retrieval → Augmentation → Generation
① Indexing:Chunk大小、重叠、元数据——错一个后面全错
② Retrieval:五种典型检索失败原因(Embedding不匹配、Query-Document Gap、Chunk切坏了……)
③ Augmentation:如何拼Prompt让LLM听话、不编造
④ Generation:模型选择、引用策略、兜底方案
技术本质:RAG解决LLM的三大局限
RAG vs Fine-tuning vs Long Context:客户永恒的三选一
PM/交付人员为什么必须理解RAG流程?
质量评估:检索质量×生成质量=最终质量
优化路线图:从跑通基线到持续运维
进阶话题:HyDE、Self-RAG、Graph RAG等变体简介
一张图总结RAG核心流程
重点笔记
RAG是四步串行系统:前面任何一步出错,最终答案都错。
检索质量×生成质量=最终质量。两个因子都做到95%以上,用户体验才有可能接近90分。
常见误区:RAG不是“接个向量数据库”,Chunk策略、Embedding选型、元数据管理、更新策略每一步都要设计。
项目落地:RAG不是一次性交付,是持续运营的系统——文档更新、模型升级、用户反馈闭环缺一不可。
