把整本小说塞进一张图?DeepSeek OCR的黑科技太省钱了!

把整本小说塞进一张图?DeepSeek OCR的黑科技太省钱了!

8分钟 ·
播放数207
·
评论数11

节目简介:

你是否在b站上刷到过《AI进化论》?就是那个聊AI怎么悄悄入侵我们生活的系列节目。而现在,它又多了一种打开方式,我们正式推出音频播客版啦!

从今天起,不用守着屏幕,随时随地都能收听《AI进化论》。每期我们都会聚焦一个新的 AI 技术成果,带你轻松拆解,一起唠明白。

本期主题:DeepSeek OCR:如何把千字文章“塞”进一张小图?

【本期内容介绍】

你是否想过,AI能像人脑一样压缩记忆?本期《AI进化论》深入解析火爆的DeepSeek OCR技术。看它如何将千字长文“渲染”成图,再用“视觉令牌”极致压缩,实现高效、低成本的信息处理,颠覆传统文字识别。

【主要话题点总结】

  • OCR技术到底是什么?我们手机拍图翻译、扫描发票,背后都是它在工作吗?
  • 像“排队买咖啡”的传统OCR,为什么在长文档面前又慢又费钱?
  • 把文字变成图片再识别,这种“反向操作”怎么就突然变高效了?
  • 压缩率高达10倍还能97%准确,再高会怎样?这像不像我们人类的记忆曲线?
  • 批量处理几千页老报纸,这项技术如何做到分钟级搞定并节省90%存储空间?
  • 这项“光学记忆”黑科技,未来能帮聊天机器人解决“记性差”的难题吗?

订阅与关注

  • 如果您喜欢本期播客的内容,欢迎访问我们的B站主页:
  • 在B站搜索GenJi是真想教会你或扫描下方二维码,进入我们的频道。
  • 直接搜索 AI进化论,即可观看完整的系列视频节目。

展开Show Notes
小财福满
小财福满
2025.11.12
其实最关心什么时候能集成到主流产品里
这波是AI的“熵减”操作吧
所以多模态表征比单一模态更高效是吗?
显存省十倍?!我们公司能省一堆钱
麻辣兔兔
麻辣兔兔
2025.11.11
03:53 从B站追到播客的在这
漫咖舍
漫咖舍
2025.11.11
想知道如果图片里有公式和表格,压缩后还能准确还原吗?
我也很关注隐私问题。。。
清风落阳
清风落阳
2025.11.11
从b站过来的,现在听播客方便多了。
如果这个技术成熟了,是不是我以后就可以用手机拍下整本教科书,让AI帮我记住重点了?(爱偷点小懒)
苹果1
苹果1
2025.11.11
光学压缩把文字变图片再解码,好大的脑洞!
Eddie_3m3x
Eddie_3m3x
2025.11.04
之前在b站刷过蛮屌的那个视频