78.Seedance之后,视频Agent何去何从?|与 OiiOii 闹闹聊视频模型的秘密:数据、生态与感性的结构化卫诗婕|漫谈Light the Star

78.Seedance之后,视频Agent何去何从?|与 OiiOii 闹闹聊视频模型的秘密:数据、生态与感性的结构化

105分钟 ·
播放数3900
·
评论数27

Sora 之后,Seedance、可灵等国产视频模型,做出了世界的高度——中国视频模型为何能领先全球?Seedance 的发布(最新已经是 Seedance 2.5 的发布啦),究竟是结束了视频 Agent 的战争,还是开启了它?

和 OiiOii 创始人闹闹,一起还原了属于视频战场上的大模型及智能体之战

(本期内容详细梳理了 Sora 之后,视频模型的发展,及视频模型训练背后的人才体系、训练方法、数据奥秘,非常值得一听,也欢迎前往各大平台-B 站-小红书-视频号等,搜索本期内容的视频版😁)

从腾讯微信、字节剪映到创立 OiiOii,闹闹特别分享了她的产品世界观——感性与理性,是一体两面。而在视频这个领域,感性如何被量化,既是科学,也是艺术。

本期嘉宾:闹闹(视频 Agent OiiOii 创始人,前字节剪映负责人)

本期 Shownotes:

02:01 Part 1. 闹闹的成长史:观察者、群体之外与"创造环境"

  • 当一件事需要你自己去创造一个环境

  • 腾讯和字节是产品观的左右脑

  • 张小龙的 8 小时内部产品演讲,"他用人类外的视角在观察人类——把人性的善和弱点放在放大器里发酵,再像园丁一样修剪”

· 在字节学到数据的应用,也看到数据的滥用——明知一个实验数据怎么才能为正,就为了正而去做它,但这不代表它长期是正的

  • 内容型产品的核心,是把感性的好与不好归类量化

18:27 Part 2. 视频模型路径的判断:从 Sora 2,到 Seedance

  • 早期视频模型以首尾帧为主——Vidu 第一次把“多参考图"这个概念做出来

  • Sora 2 验证了多参方向,开拓了模型的想象力

  • “Seedance 基本是 Sora 2 的升级版”

  • 什么是视频生成的最佳实践?

  • “描述词要加正向和负向词,要叠加约束”

  • “视频生成交互的下一步不一定是文字”

27:28 Part 3. 为什么最好的视频模型出现在字节快手这样的短视频平台?

  • “视频模型不是创业公司该做的”

  • 大公司的数据护城河:有过去做图形图像算法的积累,可以制定标注标准,执行到八九十分

  • 可灵的前世今生:2021 年,快手 Y-tech 算法团队在视频理解上就不弱于(甚至强于)字节 AI Lab

  • 两条视频模型路径:通用大底座(Seedance) vs 专业领域优先(可灵)

  • 生态是分水岭:同样的算法,能不能用好这些数据,取决于过去推荐系统里有没有相关应用经验

  • 中国为什么能在视频模型方面领先?

  • OpenAI Sora 的失败不是技术失败,是生态失败

  • 视频模型领域的护城河不是算法,是"数据标注标准 + 组织执行力"

34:15 Part 4. 模型不会被吃掉 Agent 的部分是?harness & 感性 benchmark

  • 视频模型目前的不可能三角:效果、生成时间、生成成本

  • 模型会往哪些确定性的方向迭代?

  • 多模和语言模型有哪些本质不同?——感性可以被结构化但颗粒度更粗

  • Harness 一定会进入多模和视频领域

42:33 Part 5. AI 时代的「剪映」(or not ):第二次创业为什么是 OiiOii ?

  • AI native 的产品需要新形态

  • 关于创作者的物质激励 & 精神激励

  • 动画是 Agent 适合进入的绝佳行业

  • 模拟剧组:OiiOii 的 7 个角色、改变生产组织、抽卡降本

  • 内测码 10 万人排队的原因

  • Seedance 给我的冲击有哪些

  • MidJourney 没被吃掉的原因

  • OiiOii 的产品团队,由谁构成

57:02 Part 6. Sora 关停与 Seedance 2.0:视频 agent 战场是终结了,还是开启了?

  • Sora 关停——它做错了什么?

  • Seedance 2.0 是升级版的 Sora,它的弱点是什么?

  • 海量视频 agent 涌现是"妄想"?——哪些套壳在骗钱?

  • 怎样的产品是“纯套壳”?鉴别 Agent 的厚度…

  • 视频领域不会 winners take all …

  • 为什么抖音特效的参考意义极大…

  • ACG (动画、短漫剧、游戏)的 Agent 机会:生产关系的改变才是更值得思考的价值空间

  • 我与字节:「你要相信字节是一家非常精明的公司…」

  • 如何侦查模型厂商动向?

01:32:18 Part 6.「这个时代最缺的就是谦逊」

  • 模型涨价了怎么办?

  • 国内 agent 调度的视频模型有?

  • Seedance 最值得学的是什么?

  • AI 时代顶级产品经理画像长什么样?

  • AI 时代的自信与盲目

如果喜欢「漫谈」,欢迎加入我的听友群~⬇️

展开Show Notes
君九九
君九九
5小时前
一直以为AI画图改不动是模型不行,听完才知道是底层逻辑卡着,OiiOii没硬改模型,用分工Agent就把“乱生成”管住了,把专业动画变简单了,终于听懂AI视频工具到底在解决啥真问题。 👍👍
卫诗婕_漫谈LTS
:
听得很细 ✨
很不错的一次对话,很有深度,努力学习消化中。
卫诗婕_漫谈LTS
:
可以关注一下公众号 后面会有一些文字整理
热热咖啡
热热咖啡
10小时前
主持人和嘉宾分享的这期特别好,大厂练出来的产品眼光真的难得,懂数据才能成事,让人清楚别滥用数据,做AI视频不能只顾短期效果,要把用户长期感受放在心上。
卫诗婕_漫谈LTS
:
嘉禾日上
嘉禾日上
10小时前
学习了,感觉有点深奥,不过这是大环境下需要了解的知识。
卫诗婕_漫谈LTS
:
:)
vvvvve
vvvvve
16小时前
沙发🛋️
卫诗婕_漫谈LTS
:
生而为猫奴
生而为猫奴
16小时前
01:46 现在才第一个🥹
卫诗婕_漫谈LTS
:
之前录了一个姐妹,但她项目有些问题没发🥹
晨煊-:突然意识到,国内 AI 创业圈,一号位的女性不多啊。回想上一个十年,至今依然印象深刻的也只有猫助和胡玮炜
3条回复
优质AI产品的算力、数据、人力、版权都是持续刚性成本,无法长期免费。
卫诗婕_漫谈LTS
:
庄明浩
庄明浩
12小时前
1:43:16 现在都说世界模型了 🐶
卫诗婕_漫谈LTS
:
我感觉还是不太一样 hh🐶
庄明浩:是个筐
3条回复
Mark大宝叔
Mark大宝叔
15小时前
本期主题特别感兴趣,主持人的问题也都挺好的,挺具体的。但嘉宾太喜欢抽象了,但抽象是基于个人经验和知识库的,带来的问题是,听起来不知道,跟问题的具体关系是什么…听众也是用户的话,分享者也要思考如何做好产品
卫诗婕_漫谈LTS
:
在大厂做过管理层的 可能会觉得更具体一些 我的大厂朋友反馈听感挺好的~有啥想知道的可以问我嘿嘿
桐来桐往
桐来桐往
1 小时前
让普通人也有表达自己的权利,现在看看好像有很多渠道,但在从零到有的过程之前,这种创业思维还是很有前瞻性的……
漫剧风
漫剧风
2小时前
客观自信,喜欢这个嘉宾,好赞!
02:37 开局主持人第一个问题给我听无语了,劝退
小成_e6Vx
小成_e6Vx
1 小时前
嘉宾很务实、够严谨,产业界就需要多一些这类用实力、用情怀、用热爱去推动行业发展的创业者,哪怕只是一个很细分的领域,也足以点亮一片天空,让这个世界变得更加多元、更加美好。行业对其的馈赠,我想也只会是时间的问题。主持人很棒,问题也很犀利,超喜欢,期待在保证休息和健康的前提下多多更新。
Ander_dawn
Ander_dawn
15小时前
14:23 讲复杂了,其实就是大厂工具人内耗糊弄