豆包,你怎么了?AI 进化论

豆包,你怎么了?

10分钟 ·
播放数190
·
评论数1

00:01

今天我们想跟大家说说如何能够更好的去使用AI工具,就是了解AI工具的一些优点和缺点。这样我们在使用它的时候就可以扬长避短,让它真正的帮到。

00:18

我们是这个话题非常实用,那我们就直接开始。

00:21

好的,咱们先来看看大家在使用AI工具,像豆包这样的AI工具时,遇到了一些让人头大的问题。大家都遇到过哪些让你哭笑不得的事儿?

第一案:数学题做错,小数点点飞了

00:30

比如说有网友让豆包做数学题,结果错的离谱。有的时候让它算收益率,它就给你点错一个小数点。然后有的时候会出现让它列举水浒传的一百单八将,它就会少人或者是重复,而且它认错态度特别好,但是它就是老出错。

00:46

确实挺让人抓狂的对那为什么会出现这种AI经常会出现一些让人摸不着头脑的错误呢?

00:52

其实主要的原因是因为大家以为AI可以像计算器或者是像百科全书一样什么都能做。但是实际上AI擅长的是根据海量的数据做一些预测,所以它不是一个万能的解题高手。你只有把它的能力和你的需求匹配上了,你才能真正的用好它。

01:12

懂了,紧接着我们就来看一下AI大模型在做数学题,尤其是涉及到精确计算的时候,它到底是为什么老出错。

01:21

这就跟AI的本质有关了,因为它其实就是一个文字接龙高手。比如说你让它去算一个很大的乘法,1234乘以5678,它并不是真的在利用运算法则去计算,而是在猜说下一个数字应该是什么。所以它就有点像一个人在闭着眼睛背乘法口诀,它当然就很容易出错了。而且它一旦碰到那种小数点的,比如说收益率,它就经常会把小数点的位置点错。但是它自己还会非常的自信。这种现象在AI领域里面有一个名字叫做幻觉。

01:56

那有没有什么办法可以让AI去做这些数学题的时候能够更靠谱一点?

02:00

有一个很简单的方法就是你不要让它直接给你答案,而是让它去写python代码来帮你算。比如说你可以跟它说,请帮我写一段python代码来计算这个年化收益率。本金是1万,一年后变成了11500,帮我算一下结果。要保留两位小数,这样的话它就会生成一段代码,然后你再去运行这段代码,这样就会避免它因为手抖或者点错小数点而出现错误。这其实就是让AI去做它擅长的事情写代码,然后让计算机去做它擅长的事情计算,这样分工的话就会准确很多。

02:36

原来如此。那为什么AI在处理一些比较长的对话或者比较长的文本的时候,它经常会出现这种前后矛盾的情况呢?

第二案:结论前后矛盾,一本正经地胡说

02:43

是因为它背后并没有一个统一的知识库帮它去实时的检查说我前面说了什么。所以它在生成每一句话的时候,其实都是根据它前面的一些内容来生成的。但是它并没有全局的记忆,所以它就会随着对话越来越长,就会越来越容易出现这种前后不一致的情况。这种情况也是属于一种幻觉。

03:05

那我们有什么办法可以让它在面对比较复杂的问题的时候,能够减少这种自相矛盾的情况呢?

03:11

你可以用这个提示词模板,就是说请你分步骤回答以下问题。每完成一步之后,检查是否和前面的结论一致。如果有矛盾的话,立刻修正再继续。这样的话它就会一边回答一边去核对自己的答案,然后就会大大减少这种前后矛盾的错误。

03:30

那像豆包这种多模态的AI它在生成美术图、插画或者是照片级的这种真实的图像的时候,它的底层是怎么运作的?为什么有时候会出现这种手指多画一根或者是文字模糊这种情况?

03:44

豆包和GPT,它们在生成这种图像的时候,其实是两个模型在合作。一个模型负责理解你输入的文字,然后另一个模型就类似于Stable Diffusion这种扩散模型,它是负责把这个描述变成图像。但是这个扩散模型它并不是真的理解了你的需求,它只是在拼像素,所以它经常会在一些细节的地方出错。比如说手指的数量,文字的内容或者是一些复杂的构图,它就会容易出现这种拼凑的痕迹,所以就会导致你对这个画面的控制力会变弱。

04:19

原来是这样。那如果我们现在想要用AI来画一些流程图、几何图或者是逻辑结构图,有什么比较好的方法可以让它画的又准确又高效呢?

04:29

其实直接让AI去画图的话,它经常会出错,但是你可以让它去帮你写代码。比如说你可以用python matplotlib去画几何图,然后用graphviz 或 mermaid去画流程图。这些代码都是非常严谨的,所以它就不会出现那种差不多的错误。

04:45

听起来挺方便的那还有没有其他的方法可以让我们更方便的去画这些图呢?

04:50

当然有了,还有一些工具,比如说Mermaid和PlantUML,它们是可以用纯文本的方式来描述一个图的。然后AI写这种文本的描述会比它直接画图要靠谱的多。之后你只要把这个文本复制到工具里面,它就会自动帮你生成一个非常标准的图。或者你也可以让AI帮你输出这种结构化的描述。然后你自己把这个描述复制到draw.io或者是飞书文档里面去渲染,这样分封的话会又快又准确。

05:16

那有没有什么具体的提示词的例子可以让大家去参考,就是能够让AI帮我们画出比较规范的流程图和几何图呢?

05:24

比如说你想要一个用户注册的流程图,那你可以直接跟AI说,请用Mermaid的语法画一个用户注册流程图。包含填写信息验证、手机发送验证码、注册成功或失败这几个节点,只输出代码不要解释,这样它就会给你一段Mermaid的代码。然后你只要把这段代码复制到Mermaid的在线编辑器里面,它就会自动生成这个流程图。

05:47

如果是想画一个几何图,也可以用代码来实现吗?

05:50

当然可以了。比如说你想要一个等边三角形,并且你要标注它的三条高线和垂心。那你可以跟AI说,请用Python matplotlib画一个等边三角形,并且要标注三条高线和垂心。然后输出可以直接运行的代码,它就会给你生成一段python代码。你只要运行这段代码,它就会给你画出这个几何图。

第三案:按出场顺序列108好汉?AI交了白卷

06:12

而且非常的精确,真的是太方便了。下面我们就来看一下AI在处理这种有序枚举的任务的时候,比如说要按顺序列出水浒传的一百单八将,它为什么老是会出错,而且经常会出现这种遗漏或者重复的情况。

06:27

这其实是因为有序枚举对AI来说是一个非常难的事情,因为首先它要精确的计数,它要数到正好108个人,它不能多也不能少,但是AI经常会在这个数量上面出错。然后第二就是它还要按照他们在书里面出场的顺序来排列,这就要求它要非常准确的去回忆每一个人物的情节。但实际上AI的这个记忆是非常模糊的,它不是像我们想的是一个时间线一样的记忆,它是一种非线性的记忆,所以它就经常会搞混这个顺序。最后就是它要保证每个人都只出现一次,不能有遗漏,也不能有重复。但是因为有一些好汉它的戏份实在是太少了,所以AI经常会想不起来,它就会随便拿一个人来凑数,而且它还不会觉得自己有问题,它就会非常自信的给你输出一个错误百出的名单。

07:19

如果我们想要让AI帮我们来做这种有序枚举的事情,比如说按出场顺序来列出这些好汉,有没有什么比较好的办法可以让它的准确率高一些?

07:29

有一个比较有效的方法就是你要把这个任务拆分成几个小的步骤。然后你还要告诉它你要用哪个版本的水浒传。比如说你要用120回本的水浒传,然后你就一批一批的来问它,你先让它列出第一批就是前30位好汉,然后让它按照这个格式序号、姓名、绰号、首次出场约在第几回这样的格式来输出,并且让它每一次都告诉你,它一共列了多少个人。这样的话你就可以很方便的去检查它有没有重复或者是遗漏。

07:58

分批问的话确实会容易核对一些。

08:01

没错,然后你就继续再让它列出第31位到第60位,还是按照这个格式。然后同样的要让它告诉你这一批有多少人,并且让它自己去检查有没有和前面的重复。最后你再统一的做一个核查,你说你第二批列了多少人,但其中某个人已经在第一批出现过了,请你删除重复项,并且补上遗漏的好汉。要维持总数是准确的,就是你始终要自己扮演一个监工的角色,你要去核对这个名单,而不是说你问完了就完了,这样的话准确率就会提升很多。

总结:AI是啥,不是啥

08:34

确实是这样。那我们现在来做一个小结,就是AI到底擅长什么任务,不擅长什么任务。然后面对它的这些短板,我们有什么办法可以弥补?

08:43

其实AI特别擅长的是写文章、改语法、头脑风暴、解释概念,还有翻译,包括写代码的框架,这些它都很擅长。但是它不擅长的是精确计算,完整的枚举,有序的排列,还有就是长篇的内容要保持一致。它也经常会出错,包括画图它也很弱。

09:02

那遇到这些它不擅长的事情的时候,我们有什么办法可以提升它的表现吗?

09:07

比如说你碰到计算的问题,你就直接让它生成代码,然后用代码来跑结果。如果是遇到这种枚举的问题,你就一定要分批让它输出,并且你自己要去核对数量。如果是碰到这种容易自相矛盾的长文本,你就强制它每一步都要去检查一致性。

09:23

其实AI它不是一个无所不能的神,它更像是一个语文很好,数学勉强及格,然后记忆力又很不稳定的大学生实习生。所以你只有用对了地方,它才会帮你省力。如果你用错了的话,它也会一本正经的给你犯错。

09:40

我还想问一下大家在使用AI的过程当中,有没有遇到过一些让你意想不到的小插曲。

09:45

当然有了,很多人在使用AI的时候都会被它坑过。但是其实被坑就说明你在认真的用它,你只要下次换一个问法或者换一个提示词,它可能就会给你一个正确的答案。对,大家也可以把自己的那些被坑的经历分享出来,然后我可以一起在评论区里面讨论。

10:01

好的,我们今天把大家在使用AI的时候最常踩的一些坑都给大家捋了一遍。然后也给大家分享了很多让AI变得更靠谱的一些小技巧。

10:09

行,我们这期节目就到这里了,感谢大家的收听,咱们下次再见。拜拜

展开Show Notes
嗨Ethan
嗨Ethan
8天前
这两个声音就非常 AI…