EP.2 对话InstantID:我的脸,AI前赴后继的战场

EP.2 对话InstantID:我的脸,AI前赴后继的战场

57分钟 ·
播放数394
·
评论数8

只要上传一张照片,无需等待,我的脸立刻进入瞬息全宇宙。开源工具InstantID出现,让AI写真进入了新高度,一张脸可以实时出现在任意提示词描绘的场景里,LeCun都忍不住转发互动。回顾过去一年,写真是AI领域为数不多产品化成功的方向,无论技术怎么卷,好像我们还是最先关心自己的脸。

本期除了关注InstantID年轻开发者背后的故事外,也抛出了以下问题:AI人像的产品潜力是否还没挖掘完,哪些要素让这些算法团队在竞相厮杀?期待和听众们一起头脑风暴,欢迎分享任何想法。

本期人物

  • 王浩帆:InstantID通讯作者,小红书AIGC算法工程师
  • 归藏:AIGC知名KOL,Catjourney主理人,大厂产品设计师
  • 宙宙Jo:热爱图像和开源,建设Diffuseum中,前AI投资

时间线

  • 00:46 浩帆和InstantX小组
  • 03:59 归藏和他正在做的Catjourney
  • 05:19 InstantID是什么:更高效、更自由的固定人像生成
  • 07:30 两位嘉宾为什么会各自关注人像这个问题
  • 10:36 InstantID 项目开发的历程
  • 11:06 人脸固定的技术原理,最巧妙的设计是Controlnet的输入
  • 14:02 社区应用和归藏的测评结果
  • 19:02 用户的关注点:相似度、真实性、审美、生成成功率
  • 22:28 现有市面产品,换脸 VS InstantID
  • 23:58 AI写真产品化的潜力,是否有独立团队的空间
  • 35:25 Stable Diffusion社区近期变动,生态迁移的痛点
  • 41:55 InstantID开源的正负反馈,缺乏长期激励
  • 44:11 SD社区成就了年轻开发者崭露头角的第一步
  • 46:57 SD3是否如期开源,模型继任者是否会易位
  • 50:04 对开源项目长期激励的机制讨论

相关链接

联系我们

Diffuseum 是一个对生成式图像、开源人工智能感兴趣的社区,这档播客记录我们关注的一线开发者的故事。

  • X: jojodecayz
  • WeChat: Jozhangsh
  • 公众号:Latent Cat
  • latentbox.com
展开Show Notes
sudo
sudo
2024.4.02
来啦来啦~
周尚金杭
周尚金杭
2024.4.02
希望能北京线下见面聊聊
谢谢,真的很好用
真的很好用,非常感谢
H3c_L0MO
H3c_L0MO
2024.4.20
37:49 trade off
umiiwa
umiiwa
2024.4.11
感觉同时邀请产品和研发会挺有趣
ottopan
ottopan
2024.4.02
这是 AI剪辑的音频吗?好几次我还以为小宇宙卡机了
宙宙Jo
:
有用到一些AI剪气口的工具,看来是不太丝滑。