
Sora 之后,Seedance、可灵等国产视频模型,做出了世界的高度——中国视频模型为何能领先全球?Seedance 的发布(最新已经是 Seedance 2.5 的发布啦),究竟是结束了视频 Agent 的战争,还是开启了它?
我和 OiiOii 创始人闹闹,一起还原了属于视频战场上的大模型及智能体之战。

(本期内容详细梳理了 Sora 之后,视频模型的发展,及视频模型训练背后的人才体系、训练方法、数据奥秘,非常值得一听,也欢迎前往各大平台-B 站-小红书-视频号等,搜索本期内容的视频版😁)
从腾讯微信、字节剪映到创立 OiiOii,闹闹特别分享了她的产品世界观——感性与理性,是一体两面。而在视频这个领域,感性如何被量化,既是科学,也是艺术。
本期嘉宾:闹闹(视频 Agent OiiOii 创始人,前字节剪映负责人)
本期 Shownotes:
Part 1. 闹闹的成长史:观察者、群体之外与"创造环境"
当一件事需要你自己去创造一个环境
腾讯和字节是产品观的左右脑
张小龙的 8 小时内部产品演讲,"他用人类外的视角在观察人类——把人性的善和弱点放在放大器里发酵,再像园丁一样修剪”
· 在字节学到数据的应用,也看到数据的滥用——明知一个实验数据怎么才能为正,就为了正而去做它,但这不代表它长期是正的
内容型产品的核心,是把感性的好与不好归类量化
Part 2. 视频模型路径的判断:从 Sora 2,到 Seedance
早期视频模型以首尾帧为主——Vidu 第一次把“多参考图"这个概念做出来
Sora 2 验证了多参方向,开拓了模型的想象力
“Seedance 基本是 Sora 2 的升级版”
什么是视频生成的最佳实践?
“描述词要加正向和负向词,要叠加约束”
“视频生成交互的下一步不一定是文字”
Part 3. 为什么最好的视频模型出现在字节快手这样的短视频平台?
“视频模型不是创业公司该做的”
大公司的数据护城河:有过去做图形图像算法的积累,可以制定标注标准,执行到八九十分
可灵的前世今生:2021 年,快手 Y-tech 算法团队在视频理解上就不弱于(甚至强于)字节 AI Lab
两条视频模型路径:通用大底座(Seedance) vs 专业领域优先(可灵)
生态是分水岭:同样的算法,能不能用好这些数据,取决于过去推荐系统里有没有相关应用经验
中国为什么能在视频模型方面领先?
OpenAI Sora 的失败不是技术失败,是生态失败
视频模型领域的护城河不是算法,是"数据标注标准 + 组织执行力"
Part 4. 模型不会被吃掉 Agent 的部分是?harness & 感性 benchmark
视频模型目前的不可能三角:效果、生成时间、生成成本
模型会往哪些确定性的方向迭代?
多模和语言模型有哪些本质不同?——感性可以被结构化但颗粒度更粗
Harness 一定会进入多模和视频领域
Part 5. AI 时代的「剪映」(or not ):第二次创业为什么是 OiiOii ?
AI native 的产品需要新形态
关于创作者的物质激励 & 精神激励
动画是 Agent 适合进入的绝佳行业
模拟剧组:OiiOii 的 7 个角色、改变生产组织、抽卡降本
内测码 10 万人排队的原因
Seedance 给我的冲击有哪些
MidJourney 没被吃掉的原因
OiiOii 的产品团队,由谁构成
Part 6. Sora 关停与 Seedance 2.0:视频 agent 战场是终结了,还是开启了?
Sora 关停——它做错了什么?
Seedance 2.0 是升级版的 Sora,它的弱点是什么?
海量视频 agent 涌现是"妄想"?——哪些套壳在骗钱?
怎样的产品是“纯套壳”?鉴别 Agent 的厚度…
视频领域不会 winners take all …
为什么抖音特效的参考意义极大…
ACG (动画、短漫剧、游戏)的 Agent 机会:生产关系的改变才是更值得思考的价值空间
我与字节:「你要相信字节是一家非常精明的公司…」
如何侦查模型厂商动向?
Part 6.「这个时代最缺的就是谦逊」
模型涨价了怎么办?
国内 agent 调度的视频模型有?
Seedance 最值得学的是什么?
AI 时代顶级产品经理画像长什么样?
AI 时代的自信与盲目
如果喜欢「漫谈」,欢迎加入我的听友群~⬇️


