神奇的RAG,到底是什么?贺老师聊AI

神奇的RAG,到底是什么?

2分钟 ·
播放数222
·
评论数0

能够把AI和企业知识结合起来的RAG究竟是什么呢

可能很多朋友最近都听说了RAG在一些企业场景中的落地应用,RAG实际上是Retrieval Augmented Generation的简称,简单来说,就是基于检索的增强生成。我们知道,现在大模型在企业应用中,有这么几个挑战。一个是大模型的世界知识是有限的,完全来自于模型预训练中提供的数据,企业本身的业务知识、产品知识大模型是不知道的,而通过微调等方式给大模型补充知识,成本高、可控性低,不适合大部分的场景。另外就是大模型一般都有幻觉的问题,也就是我们常说的胡说八道,在企业应用的场合里,很多是严肃的场景,对这个接受度是比较低的

那么RAG是怎么解决这个问题的呢,RAG方案中首先给大语言模型提供了一个外部的知识库,这个知识库可以是文档的集合,也可以是网站或者其他的结构化、非结构化的知识库。然后当用户提出问题的时候,通过Embedding、关键词查询等各种检索方式,从知识库中把相关的内容召回,通过优先级的重排之后,提供给大语言模型。大语言模型根据检索出来的知识和用户的问题,进行针对性的回答。这就好比给了大模型一个企业私域知识的字典,大模型可以根据用户的问题,一边查字典,一边根据字典中的说明进行回答。这个方式一方面提供了给大模型补充企业内部知识的途径,另外通过这些知识的约束,也可以大大降低大模型的幻觉问题。特别适合去做各种企业相关的问答产品,从给内部人员使用的AI业务助手,到给终端客户使用的AI客服或者AI营销等等

RAG现在已经成为了AI企业应用中最容易落地的一种方式,各种方案和产品层出不穷,但是要想真正做好RAG也是并不容易,例如怎样组织知识,怎样提高检索质量,都对RAG最后的效果至关重要,在之后的视频里,我们还会继续给大家介绍一些RAG相关的技巧和知识