AIGC 创意、产品与投资的三重对谈:未来的皮克斯会诞生在 AI 公司里吗?此话当真

AIGC 创意、产品与投资的三重对谈:未来的皮克斯会诞生在 AI 公司里吗?

83分钟 ·
播放数9256
·
评论数22

上个月底,OpenAI 宣布了一项惊艳全网的重大更新,将全新的图像生成模型加入了 GPT-4o。4o 不仅能够具备更强的编辑和合成能力,还能将文字的深入理解融入到图像生成中,通过简单的一行文字指令,就可以取代过去需要整合各种 AI 模型和工具的复杂创作工作流。毫无疑问,我们正在见证一个全新的视觉时代。

自 Sora 发布作为起点, AI 内容生成技术已经进入了惊人的发展,从最初的短秒级视频,再到如今更高画质、更强更可控的长视频生成以及精准编辑能力, AI 正在逐渐成为内容生产的核心引擎。

本期「此话当真」,我们邀请到了硅谷一线视频生成模型初创公司Luma.ai 的产品经理 Barkley,以及国内最活跃的顶尖 AIGC 创作者海辛和阿文。这是一场来自创意、产品与投资三重视角的交叉对谈,我们围绕三个主题展开讨论:

首先是针对当下 AI 视频生成行业的整体观察和技术回顾。前沿创作者们如何理解并用好视频生成工具?新一代的 AI 创意工作流会因为 4o 的发布有怎样的变化?行业内下一个突破会在什么地方? AI 视频领域距离 AGI 时刻还有多远?


嘉宾介绍
04:45 海辛:电影转 AI 内容创作者,用 AI 视频生成的内容做游戏
05:46 阿文:PPT 设计师,AI 也能做出很好的拼贴风动画
07:17 Barkley:从 TikTok 加入 Luma 的产品经理

4o 图像生成发布之后
11:38 解构图像分层:生成透明底的 png,解放生产力
13:26 Google Gemini  VS  GPT-4o 的生图体验对比
20:13 自回顾模型逆转了之前扩散模型的优势
22:40 像素之间的距离与语义之间的距离有多远?
30:23 4o 把图片转化成语言,视觉理解和视觉生成同样重要
32:15 底层模型的研究最终会带来技术层、应用层、产品层的改变
33:23 国产视频模型带来实际生产力的提升,对 Sora 反而期望过高

过去一年的 AIGC 进展的惊艳时刻
34:42 从 Sora 到可灵,再从 Midjourney 到 Google Whisk 到 GPT-4o
36:46 当大一统模型足够强大,工作流会直接被替代
38:22 4o 也有做不到的事情:高度自定义素材的无法延展、换脸只认识名人 etc
42:42 做视频生成届的 agent 或许为时过早

AIGC 不只是降本增效,而是新的艺术形态
45:05 各家模型优势不一,充会员都充哭了
48:37 复杂镜头组接的视听语言,需要有足够的数据和时间训练
54:54 现阶段无法被满足的制作需求,很快就能在某一天被实现
57:20 学习 AI 创作建议直接从源头找资料,屏蔽信息噪音
59:57 AI 诞生之后变得更幸福了吗?AI 不只是降本增效,而是新的艺术形态
01:03:02 AI 视频生成应用:3D 动画、电影和广告行业的反应速度

视频领域的 AGI 时刻是什么?
01:13:13 最容易被 AI 冲击的是类似抠图的单点工具
01:14:24 Adobe 反而比以前用得更多了:AI 破破烂烂,行活缝缝补补
01:16:30 未来的皮克斯可能会诞生在一个 AI 公司里
01:18:22 创作不再是有钱有权的人才能享有的特权

真格基金 21 期 ZhenIntern 正在招募中,合伙人亲自带,创业和投资双重体验,有转正机会。欢迎感兴趣的同学投递 zhenfund.jobs.feishu.cn

Luma AI 目前在招募 AI data 方面的人才,data PM/engineer和model infra都有opening,可在国内远程。自荐/推荐欢迎email:barkley@lumalabs.ai

海辛在开头提到的解谜游戏  aka 锈沪 - 小红书
同时也欢迎关注海辛和阿文与他们未来的创作:
微博、小红书、视频号、即刻搜索「海辛Hyacinth」、「Simon_」,X 搜索「ring_hyacinth」、「simonxxoo」

监制:Jiamin、Zoe、Wendi

后期:Yanaego

《此话当真》是一档由真格基金出品的泛商业类播客,真格基金投资团队将在此和各领域的领军人物一起分享最新热点和行业洞察。

真格基金创立于 2011 年,是国内最早的天使投资机构之一。自创立伊始,真格基金一直积极在人工智能、芯片与半导体、机器人与硬件、医疗健康、企业服务、新能源、跨境出海、消费生活等领域寻找最优秀的创业团队和引领时代的投资机会。

真格,你的创业第一站!

展开Show Notes
Zoi_
Zoi_
2025.4.22
这期信息量好丰富!用Podwise转译了份逐字稿:https://podwise.ai/dashboard/episodes/3710992
新一天星:这是什么工具吗,这么方便
温良y
温良y
2025.4.24
我是阿文的铁血老粉,感觉他一直是一个善于追求新鲜事物的人,当你在一个领域投入了一定精力后你就对新的新领域和技能探索产生惰性,我很羡慕他
探索者R
探索者R
2025.4.22
這集實在太好了
Simon_阿文
Simon_阿文
2025.4.22
终于发布了,开心!(各位老板如果有发布会需求的话,也欢迎来我们工作室定制!AbleSlide / 全屏本是,包厉害的!
海辛:超厉害👍
我公开了一个原来在字节讲的AI入门课 真心学的可以看一下 真的好懂 快来加入AI大军叭~https://b23.tv/pd5gJLr
gavinni
gavinni
2025.4.24
adobe已经在和我们合作要把media gen放进ps里啦 我在fal.ai做gtm 我们提供各种最新的模型包括kling和luma, 欢迎在linkedin联系我啦 gavin ni
理解甲方和适配甲方产品的创意一直只有设计师能做,这是目前对设计的感受。
38:02 这段好有用~就是我想听到的新信息,哈哈哈
Nini_nonono
Nini_nonono
2025.5.18
12:06 透明背景的图片真的是极其极其方便的一个素材要求了!无论是对广告素材/数字人训练/设计师编辑图层都非常重要
小卡小卡
小卡小卡
2025.5.07
1:16:39 AI破破烂烂,靠行活缝缝补补!金句
小卡小卡
小卡小卡
2025.5.07
51:56 电影解说视频是做好的标注数据?
小卡小卡
小卡小卡
2025.5.07
46:23 宝贵的经验
哇Barkley哈哈哈!
知行now
知行now
2025.4.27
如果能把对话文本放上来,就更方便听众去梳理总结其中的一些重要信息了。
讲到的是那个Ai工具啊 我不太熟悉
洋洋洋溢
洋洋洋溢
2025.4.24
11:56 标记
21:11 生成扩散模型和自回归模型
哇塞,快来听!
请问有文字稿摘要吗
Charlie_L8cY
Charlie_L8cY
2025.4.22
BGM很燃,叫什么名字ヾ(´〇`)ノ♪♪♪