Vol.41 产业观察4| 从鼠标键盘到ChatGPT:与李丰聊文本数据化与互联网行业高能量

Vol.41 产业观察4| 从鼠标键盘到ChatGPT:与李丰聊文本数据化与互联网行业

74分钟 ·
播放数11556
·
评论数40

【本期课题】

文本数据化的迭代历程与互联网行业的发展。

【栏目介绍】

在《产业观察》这档专栏里,我们会为你厘清不同产业的历史沿革,希望能够从中找到一些底层的规律。虽然当下变化迭起,但是所有新风口都有迹可循,不同产业的发展其实也有很多相似之处。

【免责声明】

本节目的所有内容并非旨在提供任何形式的建议,包括但不限于投资、税收、会计或者法律上的建议。

【内容索引】

00:45 作为技术外行,聊聊为什么是今天、为什么发生了,以及按照同一条路线来看,往后还会发生什么

02:11 过去三十年互联网最大的贡献之一,是把海量的文本信息变成了文本数据,顺着这条线索我们能够看到很多科技巨头的名字

03:01 第一个把文本数据化的普及型工具是鼠标和键盘,紧接着是Windows的图形界面操作系统

04:54 在有了足够多文本数据的基础上,第一个帮助用户连接和找到这些信息的商业模式是门户网站

06:51 在文本数据化的迭代过程中,上层是数据,中间层是算法,底层是算力

08:29 搜索框和搜索算法是谷歌在文本数据化发展历程中的两个重要贡献

13:05 在算法跃迁的过程当中,ChatGPT有没有引入新的认知逻辑使AI能够做出近似推理的抽象思考?

16:58 AIGC无论输出的是图片还是视频,都仍然是基于文本形式做的标注,还无法做到真正的多模态

18:27 我的整个职业生涯一直受到文本数据化的冲击,一边是内容生产,一边是内容分发

22:03 搜索引擎用机器来识别需求,之后按照需求匹配供给、完成分发的这件事,无论是百度还是谷歌,都是先通过给企业提供服务来矫正算法

24:57 英文的单词与单词之间有空格,但是中文需要切词,因为一句话的每个字都是连在一起的,所以做词库曾经也是一条切入搜索引擎的路径

28:14 保罗·克鲁格曼之前就说,互联网最大的功能就是供人们在网上喋喋不休地发表自己的言论,所以它一定是泡沫,因为很快人们就会发现自己其实没有那么多话要说

28:47 语言是一种抽象的表达,相比之下视觉信息更加具体且丰富,但计算机还很难像人类一样做到把注意力分配在不同的位置观察同一张图片

32:14 物理意义上的文本信息匹配效率是比较低的,但是一旦数据化了之后,数据流动几乎没有任何成本且流传效率无穷高

33:43 智能手机带来的变化不仅仅是让电脑去掉了键盘和鼠标,而且还把诸如声音、视觉、定位等各种信息用不同的芯片完成了数据化,自此移动互联网浪潮的序幕正式拉开

42:16 我为什么在10年之前投资B站?

48:42 我为什么在11年之前投资数字货币?

54:03 当时为了解释虚拟货币的商业应用,我举的最多的例子是p2p下载,一旦全部进入了数据化,交易体系和权益确认体系将会全部发生变化

57:54 ChatGPT会创造出新一代的平台和前所未有的商业模式吗?

01:01:35 垂直领域的公司,可以通过接入通用语言模型平台获益吗?

01:03:11 今天还有机会做出一个中国的OpenAI吗?

01:06:28 2016年前后也有过一波AI创业热,那一轮有哪些积累了好资产的明星公司留下来吗?

【相关文章】

文字版内容,可在峰瑞资本公众号查看。

李翔x李丰:为什么今天出现了ChatGPT?往后还会发生什么? | 李丰专栏

【制作团队】

主理人:李翔 、李丰

制作及统筹:张英海  (13514156656)、峰小瑞(pr@freesvc.com)

如果你喜欢我们的节目,欢迎你分享到更多的地方,也欢迎你在我们的评论区留言交流。

展开Show Notes
陈文金
陈文金
2023.4.07
真高能啊,我需要再听一遍
基本意思是,过去数十年科技发展的一条主线,是把各种信息/内容数据化,然后想办法跟消费者的需求去做匹配。
晚晚_rkGz
晚晚_rkGz
2023.4.11
我看了几遍倍速,确认了我开的1倍速。默默调整成了0.8
Link_01
Link_01
2023.4.17
还是一个后置归纳的逻辑,不能简单把互联网的发展归纳为信息的数字化,比如做视频的多了,为啥是抖音出来。这里有规律的必然,但更多是商业的偶然。
人生現役
人生現役
2023.4.09
50:53 这是我到目前为止,听过最好的关于数字货币的解释
丰叔的知识储备太哇塞了,感谢两位带来的梳理和比较介绍,有了更多的理解: 整体抽象逻辑— 上层:数据 中层:算法 底层:算力
整体的迭代路径: 数据化- 自动化+部分智能化- 智能化。 核心关键是信息数据化和高效的数据匹配,需求很容易数据化后供给数据就变得非常值钱。 信息完全数据化后,就需要价值分配钱了,过往的支持机制不匹配了,相对数据化的全链条效率变得极低了
Will阿望
Will阿望
2023.4.18
50:53 这是我到目前为止,听过最好的关于数字货币的解释。这个角度无敌。
庄明浩
庄明浩
2023.4.10
26:44 回想起来,宿华当年其实也是在做给2B的搜索服务,主要帮360搜索…
天宇同学
天宇同学
2023.4.11
41:02 今日头条在冷启动的时候,是用了字节更早期其他数据;抖音冷启动的时候,是用了今日头条的数据。
天宇同学:用户的行为数据——预测用户的喜好
艾云
艾云
2023.7.07
这应该知识付费了。
Dr_Lonely
Dr_Lonely
2023.6.06
原来大家已经不知道page rank了
丰叔的节目真的太好听了!
打卡
非常精彩,又有广度又有深度
44:39 第一次听到从这个角度解读为什么中国没有YouTube,非常有意思
天宇同学
天宇同学
2023.4.11
1:14:04 “GPT是否有一些算法以外的认知逻辑进入到算法当中?”
天宇同学
天宇同学
2023.4.11
42:37 YouTube的用户基础,更早期90年代风靡美国的家庭摄录一体机。
晚晚_rkGz
晚晚_rkGz
2023.4.11
太高能了
天宇同学
天宇同学
2023.4.11
18:46 文本内容:生产 & 分发 2个角度来看。
47:48 微软不是不知道,而是被反垄断的枪指着,再不收着点,就会成为第二个贝尔。