Chunking策略深度解析:RAG最被低估的工程决策

Chunking策略深度解析:RAG最被低估的工程决策

16分钟 ·
播放数1
·
评论数0

本期内容基于小红书轮播图脚本《Chunking策略》,从项目经理/产品经理视角,拆解RAG系统中chunking的核心知识点。适合AI入门、Agent开发、产品经理等角色快速理解关键概念。

涵盖要点:

  • Chunking是什么:用年假计算场景案例说明chunk切分不当导致的Agent回答错误(关键信息卡在chunk边界)

  • 五大分块策略对比:固定大小、按句子、按段落、递归分块、结构感知(合同按条款、FAQ按问答对)

  • 三个核心参数:Chunk Size(建议256-512 token通用)、Overlap(10-20%)、中文需扩大20-30%

  • 改Chunk的高成本:全库重建,1000份文档需数十分钟及¥10-50 API费用,10万份需1-2天及数千元

  • Small-to-Big策略:小Chunk(256 token)用于精准检索,对应父文档(1024 token)喂给LLM,兼顾准确率和上下文完整性

  • 常见误区与PM检查清单:不要用默认值、不要一刀切、需要做A/B实验

核心结论:Chunking是RAG的刀法,切对了检索准+生成好,切错了后面全歪。关键是针对文档类型做实验定参数,因为后期改的代价是全库重建。