EP 26. 【生成式AI专题2】ChatGPT的技术与商业演进:对话Google Brain&Stability AI

EP 26. 【生成式AI专题2】ChatGPT的技术与商业演进:对话Google Brain&Stability AI

151分钟 ·
播放数65321
·
评论数213

自从OpenAI 发布的chatGPT掀起席卷世界的AI热潮,不到3个月就积累了超过1亿月活用户,超过1300万日活用户,展现了AI让人惊叹的能力,让人感叹,下一个科技革命终于要到来。于是,这次硬核讨论就来了!

Hello World, who is Onboard!?

这次的嘉宾都是绝对的一线。有 Google Brain 的研究员,Xuezhi, 她是 Google 大语言模型 PaLM (Pathways language model) 的作者之一。还有来自 Stability AI 的技术产品经理,和来自某硅谷科技大厂的AI产品经理,曾任前吴恩达教授的Landing AI 机器学习产品负责人。还邀请到了一位一直关注AI的投资人朋友,Bill,作为主持嘉宾。

我们主要讨论几个话题:从研究的视角,最前沿的研究者在关注什么?现在的技术可能的天花板和大变量会在哪儿?从产品和商业的角度,什么是一个好的AI产品?整个生态可能随着大模型出现有什么演变?最后,Monica 和Bill 还会从投资人的视角,做一个回顾、总结和畅想。

这里还有一个小update, 在本集发布的时候,Google 也对爆发增长的ChatGPT 做出了回应,正在测试一个基于LaMDA 模型的聊天机器人 Apprentice Bard。正式发布后会有什么惊喜,我们拭目以待。

AI无疑是未来几年最令人兴奋的变量之一。我们未来会邀请到更多一线从业者,从不同角度讨论技术演进、商业的可能,甚至未来对于我们每个人和社会意味着什么。不论你是做创业、研究、产品还是投资,或许都能为你提供一些思考。

这次的讨论有些技术硬核,需要各位对生成式AI、大模型都有一些基础了解。讨论中涉及到的论文和重要概念,也总结在 show notes 中,供大家复习参考。其中几位嘉宾在北美工作生活多年,夹杂英文在所难免,也请大家体谅。

欢迎来到未来,Enjoy!

嘉宾介绍

Xuezhi Wang, Google Brain 研究员,Google 语言大模型 PaLM 作者之一。

Yizhou Zheng, Stability AI 产品和工程经理

Yiwen Li, 某硅谷科技大厂机器学习产品经理,前 Landing AI 产品负责人,天使投资人

关于主播

Monica:美元VC投资人,前 AWS 硅谷团队+AI创业公司打工人,公众号M小姐研习录 (ID: MissMStudy) 主理人 | 即刻:莫妮卡同学

我们都聊了什么

02:52 嘉宾自我介绍,fun fact: 你们感兴趣的一个生成式AI项目

大语言模型(LLM)的硬核讨论

12:07 Google PaLM 是什么?跟GPT3有什么区别?

15:47 GPT3比起GPT2 的巨大提升是怎么实现的?In-context learning 的机制是什么?

24:02 大模型不断增加参数的过程有什么挑战?还有什么影响模型效果的重要因素?

27:35 模型参数已经到瓶颈了吗?增加模型参数对落地应用有什么影响?

31:13 高质量的训练数据规模会成为模型扩展的瓶颈吗?

37:24 大模型基础上,具体场景的模型训练对数据要求有什么变化?

Stability AI 和开源商业模式

42:59 什么是Stable Diffusion? 跟其他图片生成模型的区别是什么?

55:27 Stability AI 开源商业模式是什么?

59:40 大模型背景下的AI商业模式会有什么变化?

01:08:26 训练成本会如何影响AI产品和基于开源的商业模式?

01:13:13 底层模型提供商会形成类似iOS,安卓这样的生态吗?AI PaaS 生态会如何演变?

实现下一步的可能挑战

01:22:12 What's next: 现在的LLM还有什么瓶颈?基于现有模型的天花板是什么?

01:31:27 大语言模型如何提升能力:多语言的挑战,多模态数据的作用

01:36:32 图片生成模型目前的瓶颈和未来提升的方向

01:39:18 多模态为什么对于模型提升很重要

01:42:37 多模态的难点是什么?

大模型的落地和产品化

01:44:46 What's next: 基于大模型需要不一样的AI开发工具链吗?基础模型提供商会不会提供配套工具?

01:58:48 产品经理如何思考AI的应用场景?

02:03:25 Closing: 嘉宾未来关注的AI发展领域

Monica & Bill 投资人讨论

02:07:05 今天讨论印象深刻的点

02:09:39 这次AI浪潮跟上一波有什么不同?投资人如何评估生成式AI创业公司?

02:14:44 现在是好的投资时点吗?

02:17:03 随着训练成本降低,做模型的企业护城河是什么?

02:20:00 如何看待中国的生成式AI创业机会?

02:25:36 未来让我们兴奋的AI创业机会还有哪些?

提到的公司/项目

  • OpenAI
  • GPT3
  • ChatGPT
  • Stability AI
  • Stable diffusion
  • DALL-E
  • Imagen
  • Majesty diffusion
  • Landing AI
  • Midjourney
  • Huggingface
  • DeepMind
  • Apprentice Bard

重要名词

  • Large Language Model (LLM)
  • Transformer
  • Parameter
  • Decoder
  • PaLM (Pathways Language Model)
  • Reasoning
  • GAN (generative adversarial network)
  • Chain of Thoughts
  • Self-consistency
  • Fewer shot learning
  • CLIP guided diffusion
  • Prompt engineering
  • PRFAQ

参考文章

欢迎关注M小姐的微信公众号,了解更多中美企业服务的干货内容!

M小姐研习录 (ID: MissMStudy)

大家的点赞、评论、转发是对我们最好的鼓励!希望你分享给对这个话题感兴趣的朋友哦~如果你有希望我们聊的话题,希望我们邀请的访谈嘉宾,都欢迎在留言中告诉我们。

免责:节目中的观点都是嘉宾和主持人个人观点,不代表所在机构观点,亦不构成任何投资建议。

展开Show Notes
秋山羊
秋山羊
2023.2.08
一期干货满满的关于ai的播客,但因为提到很多技术层面的东西,自己听起来比较吃力,所以整理了一份播客笔记慢慢消化吸收:https://ahamoment.zhubai.love/posts/2235014506482958336
NLive
:
太用心了,非常感谢!!
飞天_AO7:感谢你的笔记
10条回复
Zwh_utEX
Zwh_utEX
2023.2.09
非专业名词。。夹这么多英文听着太尴尬了。。
yan_A5Ab:28:01 有幸能听到这么有意思的分享。你关注在夹英文单词?是要多么无聊。。。。
桃木丁:很多都是计算机开发相关的,不是硬凹英文喔
16条回复
庄明浩
庄明浩
2023.2.07
1:17:20 关于ai或者aigc的商业模式 昨晚看小冰CEO的一篇采访 写的是小冰在游戏领域的尝试 小冰CEO明确表示如果最后还是api调用这种模式 最后一定是成本导向 再到系统集成 是老路 没得赚的 他希望可以分成(当然 这非常非常难) 就像Yizhou和Yiwen说的 你是个模型 你不能解决所有问题 不直接交付完整服务 那怎么可能收分成的钱呢? 与之相对应的我想到了游戏引擎可以分成,核心还是提供的服务到底是什么。
19:18 觉得尴尬的有没有可能是因为你只听得懂初阶非专业名词呢?每次听到这种中英混合的播客,就知道评论里有人喷...学DS的人表示没有任何不适😥语言本来就是拿来交流的
AlphaCatMeow:并不是,请设身处地想一想,和外国人在全英文的语境中,你们说话是否会夹中文?现在播客是一个完全中文的语境,听众应该大部分是国人,那么全中文的对话,专业的名词可以用英文,但也请给出一份list,让听力相对没那么好的人能够对照着听不应该吗?
最后一步:同样觉得这个女生中英夹杂的太难受了,如果非要这样说,也可以全英文啊。听起来很多非必要的词语都一定用英语说,既然这么习惯咱们只说英文大家也可以听的。
11条回复
听完,特别是1:17:20 关于ai或者aigc的商业模式的部分听了几遍。
现在来看,刨去网上无脑吹的部分,GPT最大的问题依旧是如何产品化。技术层面,GPT是好东西,毫无疑问,但是如何由一项技术变成一款产品,一项服务,这个始终还在探索中。关于如何赚钱,也就是定价策略,根据每一个行业现有的交付方式进行定价,可单项收费,也可全案收费
考纳斯之夏:相对于成本,简单的订阅或者调用付费并不是chatgpt可用的商业模式
许克龙:看这意思:还是得与行业或业务结合。
好多人说夹杂英文的事,但其实在国外时间长的人都是英语思维思考的,不是说想说英文,可能是真的想到的是英文
丸子_Zs2Y:你也没花钱听这播客呀…?不想听就不听了也不必说嘉宾有病
丸子_Zs2Y:语言是流动的,大部分我身边的朋友出国后都会受到日常交流的影响,平常交流夹杂英文真的太正常不过。哪怕平时我自己过年回家也会觉得方言说不利索。你在别的留言下面说设身处地,你自己有没有对主播和嘉宾设身处地呢?
4条回复
Liter
Liter
2023.2.09
讲话时候咽口水的声音太明显了
good_luck
good_luck
2023.2.07
来一期介绍chatgpt的应用场景的吧,看看未来还能升级哪些应用~ 还有未来通用模型的成本和机会~
莫妮卡同学
:
成本聊了啊,场景我觉得现在大家讨论都还不成熟
good_luck:它还是在对人的需求的理解上比较强
8条回复
RoyZ
RoyZ
2023.2.09
果然全程无人话,还好小编做了预告🤣
haitaoyao
haitaoyao
2023.2.14
2:00:40 在 amazon 学到的 prfaq 是非常好的工具
haitaoyao:关于 pr/faq 更多信息,见https://productstrategy.co/working-backwards-the-amazon-prfaq-for-product-innovation/
礼_E47T
礼_E47T
2023.2.08
您好,我之前就下载了Draw things,但是下载模型一直失败,开发者给了我下载链接,但是打开软件之后,仍然需要下载,在应用商店的评价页面,我一直给的是五星,开发者认为可能是被墙了,手机版的stablediffusion我还是非常向往使用的!
莫妮卡同学
:
我也去试试!
刘渔绿
刘渔绿
2023.2.15
很精华的一期播客。受众可能比较窄。半个从业者听起来很舒适,业外人士可能需要补一补“先修知识”。
KKGoAI
KKGoAI
2023.2.11
听完了整个podcast非常的赞,期待博主以后可以有更多类似的分享。感谢感谢。
Ychao
Ychao
2023.2.09
听着太过瘾了,业界人士对于ChatGPT的点评和主持人的问题都非常好
queeniehan
queeniehan
2023.2.09
讲的好棒,希望多出这样的播文,网上那些都太水了
Cheers干杯
Cheers干杯
2023.2.08
还是得读PhD
天驰Tian
天驰Tian
2023.2.14
这一期太棒了,一片狂热中为数不多冷静专业又有思考的声音。想问下会不会有字幕可以读一下?我记得男嘉宾提到了 jeff dean 的一个 blog,想了半天想不起来叫啥,以及 google 没搜到。
天驰Tian:有一个叫什么 legacy 啥的,提到 5% 是模型剩下的其他的技术。不是 pathway 那篇。
天驰Tian:legacy of ML system
haitaoyao
haitaoyao
2023.2.13
18:57 大力出奇迹:chatgpt 是参数规模到一定规模后就解锁了 context 相关能力,而 bert 等小模型就不行、需要 fine tuning
-zJ_hxQv
-zJ_hxQv
2023.2.09
试图听一下,五分钟放弃,都是英文门槛太高
饭饭yeah
饭饭yeah
2023.2.09
外行人完全听不懂