
本集播客邀请了爱诗科技联合创始人Jaden,和我们一起聊聊对于PixVerse R1这个全新的“通用实时世界模型”的探索和思考。从2023年创立以来,爱诗一直是视频生成领域的佼佼者,而这次他们带来的这个全新的技术demo,也让我们看到了视频技术全新的演进方向。
【405游局播客简介】
《405游局》是一档长期关注互动娱乐与技术变迁的播客。我们讨论游戏,但不只讨论游戏本身;我们关注AI,但不止于模型参数。我们更关心的是——当技术发生跃迁,娱乐如何被重写?创作者如何改变?产业的结构会如何被重构?
我们希望长期记录互动娱乐的变化,与真正身处其中的人展开深入对话,持续输出更系统、更有密度的内容——试着留下对这个阶段真正有价值的观察与思考。
【本期简介】
一周前,PixVerse R1上线,拿到邀请码体验了以后,我的感觉很像2023年第一次用到Midjourney画图的感受:新鲜、颠覆,也许不太完美,但充满了想象空间。
于是很快地,我邀请到了爱诗科技的联合创始人 Jaden,来 405 和我们聊聊他们在这个产品和这项技术上的思考。也希望这场对话能给更多在新的交互娱乐形式上探索的朋友们带来一些启发。
作为一项全新的技术、一个新物种,在生成质量上,肯定还有很大的提升空间。但是,它的实时生成,它的随时交互以及可以想象的“言出法随”的感觉,会极大的带来一种新的体验。也在这种体验之上,我们更期待未来这项技术可以落地的场景,和带来的新的娱乐交互玩法。
本期嘉宾:Jaden | 爱诗科技联合创始人
如果对我们聊的内容和话题感兴趣,欢迎关注同名公众号获取加入社群的信息,或者添加微信号:Gamejokers
【时间轴】
00:55 PixVerse R1介绍:“Real-time World model”
02:22 测试用户在怎么玩R1?
相比于预设场景,更多内测用户喜欢自定义。既有“现实进入”的场景,也有虚拟场景。
05:27 除了打字,还有哪些交互的可能性?
文字 Prompt 的门槛依然太高。 随着实时性加强,语音和手势甚至更精确的眼动信号,才能真正释放“即时创作”的潜力。
07:36 发散vs约束?
目前有两套模型,一套是无限发散,一套是相对收敛。最终应该走向一个相对受限但有足够开放性的系统。
14:19 为什么会在这个时点选择去做实时互动的视频模型?
视频生成是“新一代摄像头”,而不是“AI 导演”。 泛用户需要的是零等待、傻瓜式、及时的反馈。
19:37 创作范式的变化,最终会导向什么结果?
创作与消费的界限正在模糊,生成与推荐的界限也在模糊。
21:44 技术解析:Omni架构
29:30 R1的用户最开始可能是谁?
31:23 交互视频模型,会先影响或者颠覆哪些行业?
不做“替代”,做“增量”。 它会催生出一种长得既不像短视频、也不像传统游戏的新形态互动娱乐。
38:24 商业化的思考
43:36 对于World model的理解和思考
47:44 随着R1的演进路径,最想攻克的挑战?
不远的未来可以上线1080p,更快的响应速度(<1s),以及产品化
48:32 想招聘什么样的游戏行业相关的同学加入团队?
49:57 推荐美剧《黄石》,推荐游戏《王者模拟战》
