EP.1 00后一份课堂作业,如何让AI生图10倍加速Diffuseum

EP.1 00后一份课堂作业,如何让AI生图10倍加速

32分钟 ·
播放数379
·
评论数7

00 后 AI 研究者 Allen 的课堂大作业 LCM 让 Stable Diffusion 推理速度加快了 10 倍,让 AI 生成图像迈入了实时推理的台阶,也因此在开源社区获得了数百万的下载和应用。

本期播客除了分享这位年轻研究者的个人背景以及社区故事外,也抛出了一个开放性观点:生成的“实时性”对C端用户构成了AI交互体验的质变,因此蕴含着绝佳的产品机会。

那么,哪些形态的应用会因此得到变革?我们期待和听众们一起头脑风暴,欢迎和我们分享任何想法。

本期人物

  • Allen Luo:清华大学交叉信息研究院硕士,LCM(Latent Consistency Models)、LCM-LoRA作者
  • 宙宙Jo:美元基金 AI 投资,热爱开源,Diffuseum社区及播客建造者

时间线

  • 00:35 00后研究者Allen的学术经历
  • 02:36 为什么会对推理加速这个方向感兴趣
  • 04:57 3个月内从课堂大作业发展到完整开源项目
  • 06:10 LCM的原理,为什么可以让Stable Diffusion推理加快10倍
  • 08:32 从理论到社区易用性的里程碑:LCM LoRA
  • 11:10 百万下载,超出预期的开源社区影响力
  • 12:16 和Huggingface的合作方式
  • 13:06 LCM当前的用户和代表应用案例
  • 15:25 总结出圈的核心原因:“实时性”对终端用户交互体验带来了质变
  • 17:27 社区对Allen的改变:从个体研究者到关注用户反馈
  • 20:20 LCM的Roadmap:探索视频/AR媒介上的产品想法,关注实时推理对交互形态的改变
  • 25:14 Sora发布的感受:对Diffusion的上限充满信心
  • 30:00 观察95后AI研究者的共性:更追求结构性变化;动手能力强

相关链接

联系我们

Diffuseum 是一个对生成式图像、开源人工智能感兴趣的社区,这档播客记录我们关注的一线开发者的故事。

X/WeChat: Jozhangsh

展开Show Notes
Ambre_qf88
Ambre_qf88
2024.3.05
非常惊喜能在小宇宙听到关于AI如此深入的内容!主播口条也好清晰听感很舒服~ 但是可能因为这些技术内容双方都比较熟悉了,有些技术名词就不会额外解释,对于普通听众来说会跟不上 🥹 如果能够增加一位“嘴替”帮我举手暂停问一下“这是什么意思啊?”会好很多~节奏上也会有一个快慢的交替~
Ambre_qf88:期待下期!!👏👏👏
宙宙Jo
:
感谢安波老师!
节目太少了!
小恰
小恰
2024.2.29
感觉很不错
TinaXu_1YIS
TinaXu_1YIS
2024.2.28
🎧🫡🧡
Ss_tWKE
Ss_tWKE
2024.2.28
支持!