尤洋:开源视频生成模型 Open-Sora 的深度解读与思考|潜空间奇绩创坛

尤洋:开源视频生成模型 Open-Sora 的深度解读与思考|潜空间

67分钟 ·
播放数226
·
评论数0

本次潜空间邀请了潞晨科技创始人兼董事长尤洋,他将带来对 Open-Sora 的解读与思考。「Open-Sora」是潞晨科技 Colossal-AI 团队研发并完全开源的视频生成模型。

💡关于「奇绩潜空间」:

我们找到了 GenAI 时代冲得最快的一批创业者 / Researchers ,如月之暗面(Moonshot AI)创始人杨植麟、AI 硬件 Rabbit-R1 创始人吕骋等,来分享自己的亲身经历和见解,希望可以为所有 GenAI 时代的创业者、从业者提供可借鉴、可复制的经验。

本期文字稿:奇绩社区内容精选

🎙️本期嘉宾:

尤洋: 清华大学硕士,加州伯克利大学博士,新加坡国立大学计算机系的校长青年教授;曾任职于谷歌、微软、英伟达、英特尔、IBM 等国际知名厂商;曾创造 ImageNet、 BERT、AlphaFold、ViT 训练速度的世界纪录。

Open-Sora 是潞晨科技 Colossal-AI 在今年 3 月发布开源视频生成模型 ,在 GitHub 上已经获得 1.9 万个星标用户。

开源项目链接:github.com

⏰时间轴

01:06 尤洋个人技术背景

00:04:19 回顾OpenAI—Sora的业界影响

00:06:08Open—Sora的设计初衷

00:07:51 Open—Sora的模型架构

00:12:31 Open—Sora的训练流程

00:19:40 训练所用的数据集

00:28:57 未来的规划

00:33:19问题1:Open-Sora为迭代做出了哪些调整?

00:34:40问题2:Open-Sora未能公开给大众的原因是什么?

00:36:18问题3:为什么视频模型的参数小于文本模型?

00:39:20问题4:Open-Sora更偏科研还是商业?

00:46:53问题5:价格战是否会挤占Open-Sora的生成空间?

00:54:40问题6:如何看待出海这部分的业务?

00:57:43 问题7:个人怎样看待科研和创业的关系?

01:01:07问题8:创业过程中最艰难的时刻是什么?

01:03:32问题9:过去三年内读过的最有意思的书?

👉【奇绩潜空间】报名通道奇绩潜空间是 GenAI 时代冲得最快的一批科研学者/从业者/创业者聚集的 AI 人才社区,我们定期邀请大模型前沿创业者分享产品实践探索,如杨植麟、吕骋、闫俊杰等,邀请前沿科研学者分享最新技术进展,如姚顺雨、蔡天乐等。欢迎关注奇绩,报名……添加小助手

🙋活动报名 & 听友群,欢迎扫码加小助手: