A16Z：视频模型进入“产品时代”，不会有“神级”视频模型

没有“神级”视频模型的时代，我们如何进入视频 AI 的“产品化”新纪元？

在过去的一年里，我们习惯了视频模型在可衡量的基准上实现无休止的改进，例如更长的视频输出、更好的物理效果和角色一致性。然而，现在是时候挑战这个假设了：没有一个能精通一切的“神级”视频模型。

本期节目将深入探讨视频模型领域正在经历的关键转变：

1. SOTA 神话的终结： 模型的进步在真实感和审美质量方面达到了一个高原期，因为一旦输出看起来已经足够像真实生活，它们还能变得“更真实”多少呢？。因此，追求“最先进水平”（SOTA）的概念可能在视频模型领域不再适用。

2. 模型的专业化分工： 当真实感不再是主要的区分因素时，我们迎来了多样性和专业化的“丰盛时代”。我们看到模型开始专精于特定维度：例如，Veo 3 在物理效果、复杂运动和音视频同步方面表现出色，适合专业用户；而 Sora 2 则擅长叙事、从简短提示中“导演”故事或制作 meme，更适合消费者。

3. 创业者的巨大机遇： 这种专业化趋势对于初创企业来说是极好的消息。即使模型级别的进展完全停止，创始人仍然有数年时间来围绕现有模型的能力构建产品。市场迫切需要更好的端到端产品来填补模型能力与实际应用之间的巨大差距，将复杂的跨模型工作流整合起来，解决特定行业（如家居布景、营销或动画）的垂直用例