
OpenClaw安全漏洞堪称史上最大,养虾人怎么办?|对话万径安全创始人司红星这几个月,很多人第一次对 AI 产生了同一种复杂情绪:一边兴奋,一边发毛。 兴奋是因为,AI 终于不只是陪你聊天了。 它开始真的替你做事。整理文件、调用权限、跑任务、写邮件、安插件、接工作流,它不再只是给建议,而是直接下场执行。 发毛也是因为这个。 过去我们担心 AI,主要是担心它"说错"。现在真正让人紧张的,是它做错。 说错一句话,最多误导你。 删错一批文件、暴露一个端口、接管一个权限、装进一个被投毒的 skill,后果就完全不是一个量级了。 这也是为什么,围绕 OpenClaw 的争议,表面上看是在讨论安全,实际上讨论的是另一件事: 当 AI 开始接管电脑, 风险就从内容层, 第一次升级到了执行层。 这场访谈里,坐着三个人。 非凡资本的赵亮 Abner 负责把问题抛出来,财经媒体人兰序负责把问题追深,真正把这件事讲透的,是万径安全创始人司红星。访谈一开场,三个人的身份就已经摆明了,讨论也很快进入核心:OpenClaw 到底是一次生产力革命,还是一次被低估的安全预警。 我听完整场访谈后,想到的不是"OpenClaw 很危险",也不是"大家赶紧去养虾"。 而是: OpenClaw 第一次把 AI 的风险, 从"答错题"变成了"做错事"。 这才是这场访谈真正有价值的地方。 这次监管为什么反应这么快 很多人对这波监管有点意外。 但司红星的解释其实很直接: 这不是普通的漏洞预警,也不是传统意义上的一次软件安全事件。它对应的是一种新型风险——AI 自主执行带来的系统性风险。3 月 8 日到 3 月 11 日连续预警,在他看来非常罕见,但也非常合理。因为这次不只是"一个工具有漏洞",而是"一个能直接执行任务的 AI,正在被大量普通人交出权限"。 这两件事的区别,决定了监管逻辑也完全不一样。 聊天型 AI 出错,通常是内容风险。 它可能事实说错,判断偏掉,甚至一本正经地胡说八道,但大多数时候,问题还停留在"生成层"。 OpenClaw 不一样。 它一旦出错,可能就是删文件、泄露信息、误调用系统权限,甚至把操作系统暴露给不该暴露的人。司红星在访谈里说得很清楚:这已经不是原来的内容风险,而是执行风险。 这就是这轮监管最核心的背景。 不是在打压 AI。 而是在提醒所有人: 当 AI 能替你操作系统, 安全就不再是附加题,而是必答题。 OpenClaw 为什么会让人又兴奋又紧张 我很喜欢司红星讲的一句话。 他说,自己第一次接触 OpenClaw 时,第一感觉就是"兴奋又紧张"。 兴奋在于,终于有人把 AI 从聊天框里拽了出来。 过去大家讲智能体,很多时候还停留在 workflow、自动化、演示视频、PPT 和概念层。OpenClaw 不一样,它直接把 AI 推到了执行层。不是帮你想,而是帮你做。它甚至改变了人和电脑交互的方式,也让更多普通人第一次真正感受到 Agent 带来的冲击。 因为一旦 AI 不只是回答问题,而是接管权限、读写文件、调用接口、跑系统流程,它获得的就不只是上下文,而是行动能力。司红星在访谈里提到,过去连他们自己做产品时,也从来没想过"把所有权限默认交给 AI"。OpenClaw 最让安全从业者警觉的,不是它聪明,而是它在便捷和安全之间,明显先选了便捷。 这也是 OpenClaw 爆火的真正原因。 不是因为它最稳。 而是因为它最先把"AI 员工"这件事做得足够直观。 你只要一句话,它就去动。 这很爽。 但也正因为这样,它第一次把风险从"模型幻觉"升级成了"执行事故"。 真正麻烦的,不只是这只虾,而是它背后整条供应链 这场访谈里,赵亮 Abner 提了一个很关键的问题: 今天大家最容易忽视的,不是 OpenClaw 本身,而是它背后的skill 市场、第三方插件、依赖包、组件链路。 司红星的回答也很硬。 他的意思大概可以浓缩成一句话: 只要是人能输入、能上传、能修改的地方, 就都可能成为攻击入口。 很多普通用户天然会有一种错觉: • 平台上的 skill 看起来像官方生态;• 热门开源组件看起来像成熟方案;• 知名开发者发布的东西看起来也像可信内容。 但安全世界的原则恰恰相反。 默认不可信,才是起点。 司红星在访谈里明确说,他们自己对社区插件的处理原则,就是"所有上传内容默认不可信",先 AI 审核,再人工复核,最后白名单放行。 问题就在这里。 OpenClaw 的很多用户,不具备这样的判断力。 他们会默认 ClawHub 上的 skills 是可信的,会默认社区生态已经替他们做过筛选。但如果平台审核机制弱、发布者账号被劫持、依赖链路被投毒,最终出事的时候,普通用户几乎没有能力提前识别。 而且这还不是全部。 司红星还提到一个更底层的问题: 你今天安装 OpenClaw,风险不一定来自某个 skill,也可能来自它依赖的第三方组件。因为它本身就建立在一大堆开源依赖之上,只要其中某个组件升级时被埋了后门,安装过程本身就可能已经不安全。 这就是为什么供应链问题比很多人想得更麻烦。 你以为你装的是一个工具。 实际上你装进去的, 是一整串你未必看得懂、也未必能审计的外部代码。 关键行业为什么会特别谨慎 谈到这里,兰序追问了一个很重要的问题: 金融、能源、运营商这些行业,现在到底怎么看 OpenClaw? 司红星给出的回答,其实特别现实。 这些行业不是不想用。 恰恰相反,他们非常想用。因为他们也知道,这不是一个小功能升级,而是一轮真实的生产力变化。谁先适应,谁就可能在下一轮组织效率竞争里抢到位置。 但他们也不敢乱用。 原因很简单: 一线员工一旦把权限随手交出去,泄露的可能不是普通资料,而是 API、业务数据、敏感流程,甚至是关键基础设施相关的信息。对这些行业来说,问题从来不是"好不好玩",而是"出了事谁来承担后果"。 所以现在更常见的状态不是全面拥抱,也不是全面封死,而是: " 让少数有安全意识的人,在有限范围内先试。不是为了立刻把它大规模塞进生产系统,而是先让组织感受到这场变化,理解这种新工具会怎么改写工作方式。 司红星在访谈里明确说,他感受到很多管理层已经认了这件事:生态必须接入,只是权限必须先管控。 这个判断很重要。 因为它意味着,真正成熟的组织反应,不是一刀切,也不是立刻全员上马。 而是先做一件更难但更对的事: 把注定会进入组织的能力,先纳入治理。 大厂下场,能不能把问题一次性解决 很多人现在很容易抱一个希望: 既然大厂已经开始下场做"安全版龙虾",那是不是很快就能把这件事解决掉? 司红星的答案很明确:不会。 他的逻辑也很清楚。 如果你只是做应用层的管控,比如给 skill 市场加审核、给权限加围栏、给部署流程加一层安全壳,那当然有帮助。但问题在于,只在上层做管控,并不能替代底层风险的解决。 因为你今天拦住了某个被投毒的 skill,明天可能暴露的是底层依赖;你今天限制了某些调用权限,明天可能被挖出来的是框架本身的漏洞;你今天做了一个"安全部署助手",明天部署进去的依然还是那只原始龙虾。 司红星在访谈里打了个很形象的比方: " 如果底层不是自主可控的,只在上层补漏洞,就像打地鼠。你按下去一个,另一个还会冒出来。 这句话其实把下一轮竞争的关键说透了。 以后大家拼的,未必是谁最像 OpenClaw。 而是谁能把底层真正做到可控。 "中国版 OpenClaw"到底应该看什么 这一段我觉得是整场访谈最有判断力的部分之一。 赵亮 Abner 提到,国内已经有厂商在做"中国版 OpenClaw",问题是:这种替代到底靠不靠谱? 司红星给出的标准非常明确: 别先看长得像不像, 先看底层是不是自己写的。 他讲得很细。 所谓底层,不只是界面,不只是一个控制面板,也不只是接了几个国产模型。真正要看的,是规划执行、反思、记忆、知识管理、执行沙箱、依赖组件、调用链和权限机制,到底是不是自主可控。 这套标准很残酷,但也很现实。 因为只要你底层还是套国外开源框架,就仍然可能引入第三方组件风险,仍然可能被逆向,仍然可能在关键环节被投毒。 所以问题不是"能不能做一个看起来像 OpenClaw 的产品"。 问题是:你做的是壳,还是底座。 这也是为什么司红星反复强调"自主可控"这四个字。 在关键行业里,大家真正关心的从来不是功能演示,而是可观测、可追溯、可审计、可管控。 AI 执行了什么,为什么执行,哪一步经过了授权,哪一步是自主完成,事后能不能回溯,出问题能不能定位,这些才决定它能不能进组织。 说白了,大家买的不是一个会干活的 AI。 大家买的是一个 出了事也讲得清楚的 AI。 普通人到底要不要养虾 这场访谈最有意思的一点,是它没有把结论推到极端。 不是"别碰"。 也不是"闭眼冲"。 司红星给普通用户的建议,反而很开放: " 普通人可以大胆体验,但前提是别在工作电脑上乱来,别碰敏感数据,别把默认设置当安全设置。 他说得很实在。 如果你只是想让它帮你排日程、写邮件、整理文档、做旅行计划,这些场景完全可以试。因为这类使用带来的后果通常有限,更重要的是,它能帮助普通人尽快理解这场范式变化。 但如果你非要在生产电脑里玩,那最起码要守住三条底线: • 先开启认证,不要裸奔;• 不要暴露公网端口;• 坚持最小权限原则,不要给它管理员级别的访问能力。 这三条不是高级建议。 这是最低门槛。 因为当一个 AI 已经开始真的执行操作时,安全不再是给专家准备的附加知识,而是每个使用者的基础常识。 企业最不该做的,是假装这事不存在 我很同意司红星对企业负责人的那段建议。 他说,不建议一刀切封禁。更合理的做法,是建立管控机制:先盘点谁在用,再明确哪些场景禁止使用,再提供替代方案。涉密场景、生产环境、核心系统,应该明确禁用;普通办公和体验性场景,则可以在可控范围内试行。 这套建议的高明之处在于,它没有装作"所有问题都解决了",也没有逃避"这件事迟早会来"。 因为 OpenClaw 代表的,不只是一个产品。 它更像一个提前到来的信号。 它告诉所有组织一件事: AI 不会永远停留在聊天框里。 它迟早会进入流程、进入系统、进入权限、进入组织分工。 所以企业现在最不该做的,不是"要不要接入",而是"有没有准备好在接入之前先管起来"。 写在最后 我觉得这场由非凡资本赵亮 Abner、财经媒体人兰序和万径安全创始人司红星完成的访谈,最后最有价值的,不是一堆安全术语,也不是一串风险清单。 它真正说透了一件事: Agent 时代已经开始了。 但能不能进产业、进组织、进真实业务,不取决于它会不会干活,而取决于它能不能被管住。 OpenClaw 这波最大的意义,可能不是让更多人开始"养虾"。 而是让所有人第一次看清,下一轮竞争不只是"谁更聪明",而是"谁更可控"。 谁先把这件事想明白,谁才算真的看懂了这只小龙虾。 AI 一旦开始执行, 安全就不再是外围问题, 而是产品能不能进入真实世界的门槛。
与头部玩家漫谈「AI漫剧」|对话漫谭、艺界创想和水母智能短短几个月,AI 漫剧从「圈内尝鲜」变成了「全网热词」,在2025年11月底,我们非凡产研在北京主办的AI创造者峰会上,AI漫剧也是绝对的主角,在一场圆桌论坛里,本栏目主持人Abner,作为论坛主持人,采访了三位AI漫剧的从业者,他们是漫谭制片人埋云、艺界创想创始人柴雯、水母智能(触手AI)联合创始人周志鹏,一起聊一聊过去几个月都发生了些什么,2025年有可能会是AI漫剧的元年吗? 一、AI 漫剧的爆发,不是巧合,是三股力量对冲出来的必然 为什么短短几个月,AI 漫剧从「圈内尝鲜」变成「全网热词」? 埋云给的答案很干脆:技术方、平台方、制作方,三股力量正好在同一个时间点对上了节奏。 先是技术突然提速。 过去做一部传统动画,二维也好、三维也好,周期动辄以月年为单位,十几个工种排成一条长链:原画、分镜、上色、合成……每一个环节都烧钱、烧时间。 而现在,AI 把这条链砍掉一半:很多中间工种被收缩为导演+剪辑+AI 小组这样的小团队,30~40 天就能跑完一部剧,成本从想都不敢想变成咬咬牙可以试。 接着是平台闻到了味道。 抖音、快手、B站、爱奇艺在前几个月几乎同时推出漫剧扶持计划——因为它们看得很清楚:短视频红利见顶,真人短剧又卷得血流成河,要想找到新的增量,只能去开辟新的内容带。 AI 漫剧刚好满足三个关键词:可规模化生产、形态新鲜、商业模式可复制。 再往下是创作端的心态转变。 在传统工业里,动画是高度专业化的领域,对个人创作者极不友好。而 AI 来了以后,门槛被拆掉了一大截: 不会画画,但有审美,可以; 不是科班出身,但看片量足够大,也可以。 大量原本不可能进入动画行业的人,被吸进了这个赛道。 柴雯的概括是:这是生产端效率,撞上消费端需求的结果。 当技术足够成熟,能在某个赛道真正落地时,爆发只是时间问题。 周志鹏则补了一刀:内容形态本身也在变。漫画平台这两年 DAU 下滑明显,长剧、电影也都在跌。真正疯狂增长的,是短视频、碎片化内容。 真人短剧已经卷了五年,女性用户被服务得很好,但男性向题材、更多垂类内容一直缺位。AI 漫剧刚好补上了这个坑——既能控制成本,又能玩各种题材,于是整个盘面突然通电。 技术、平台、创作者、用户习惯,这四张牌一起到齐,AI 动态漫才有了今天的火爆,而不是某个爆款工具的偶然胜利。 二、AI 做素材,人类做作品 技术的高潮来得很快,但真正决定行业走向的,还是那句老话:技术从来只是工具。 埋云回忆,2024 年刚开始接触 AI 时,他们是失望的——画面粗糙,人脸崩坏,连基本的一致性都保证不了,根本谈不上作品。 到了 2025 年,模型能力一轮一轮迭代,忽然有一天,大家发现:咦,我们已经可以用 AI 完成一个能看的故事了,甚至有一点艺术表达。 失望转成激动,激动之后,又逼着自己冷静下来:AI 到底能帮我什么?哪些环节可以交给它,哪些地方我必须亲自把关? 这一点上,柴雯的视角很典型。她来自传统影视,做过《长津湖》《志愿军》这样的项目,对工业流程有极深的体感。她说:AI 现在产出的东西,最多叫素材,不叫作品。真正让一堆素材升级为一个作品的,是多年积累的项目经验,是导演的视角、叙事的节奏感,是对情绪、镜头语言、审美的一整套综合判断。 换句话说,AI 可以加速把想象变成可视化的过程,但它替代不了对人性、情绪和价值观的理解。 Al更多的是协助工作、辅助产出,根据创作者的知识积累、思想层次、经验认知等,高效整合并且发散边界,最终由创作者决定成形的内容。 周志鹏则用自己公司的历程,标记了 AI 图像/视频技术的四个阶段: 第一阶段,大家在 Discord 上玩模型,技术是玩具; 第二阶段,穿越次元裂缝那一波,创作欲被点燃; 第三阶段,LoRA、ControlNet 这些能力起来,AI 从玩具进化成生产力工具; 第四阶段,从 2023 年下半年开始,技术真正扎进具体行业,比如漫剧。 现在这个阶段,在他眼里,很像移动互联网刚起步的那几年:沙雕应用满天飞,生命周期很短,却有旺盛的生命力。 你可以笑它粗糙,但无法无视那个正在解锁的可能性空间。 这就是我们今天看到的矛盾:一边是惊人的效率,一边是仍然粗糙的作品;一边是上限还没看见的兴奋,一边是底层审美还没跑出来的焦虑。 而真正的答案,大概藏在下一部分——人和 AI 是如何一起把一部 AI 漫剧生出来的。 三、一部 AI 动态漫,是怎么被孵化出来的? 如果把一部 AI 漫剧当作一条生产线,它其实有两条管线交叉螺旋前进:一条是漫画;一条是图生视频、多模态生成。 所有的智能,都在围绕一个核心问题打工:如何让关键岗位——选题、编剧、导演、分镜——在高并发的情况下,仍然保持专业判断? 在水母智能的实践里,流程大致是这样的:起点是小说 IP。 他们上游和三百多部小说签约,每个月有固定的选题会。先让选题 Agent做一轮粗筛:体裁、节奏、人物关系、爽点密度、用户画像……然后再由资深选题老师做第二轮判断。 AI 提供的是数据视角,人类掌握的是直觉视角。 确定选题之后,是改编。 如果是长篇漫画连载,AI 可以帮你顺改 80% 的内容,把文字拆成分镜、对白和节奏。但如果是两分钟的漫剧,节奏极其紧凑,每十几秒就要有情绪起伏,这时候 AI 目前只能做到 20%~30%,剩下的一定要编剧深度参与——删改情节、强化冲突、调整节奏。 再往后,是画面与生成。 这一块 AI 的介入度最高,平台上的用户形态非常多样:高中生、在职公务员、五十多岁的大姐,都在用工具参与创作。 你可以理解为:AI 把会画画这件事抽象成一套参数和模板,让原本没有手绘能力的人,也可以参与到画面生产之中。 但有几个环节,依然是 AI 触碰不到的——或触碰到了,也远远没达到可交付的水准: 草图分镜,这关乎镜头语言,而不是单帧好不好看;导演分镜,AI 可以先出一版,导演再修,决定镜头的节奏和情绪走向;配音,目前高质量漫剧依然依赖真人,因为情绪上限、台词节奏感,AI 还追不上。 当这些环节分工明确之后,成本结构就完全变了。 周志鹏给出的数字非常直观:他们最早做漫画,一集成本七千多;现在做一集 AI 漫剧,做到精品级别,一两千就能搞定。 当成本从只敢做十几部变成可以试五十部,整个行业的试错方式也就跟着变了。 不是在单一项目上纠结能不能成,而是在一大片作品中寻找什么能成。 四、从 PUGC 到 UGC:机构会变成谁的地基? 当生产线被重新定义,另一个问题也就浮出水面:在一个未来可能是 UGC 主导的生态里,机构到底还干嘛? 一位现场观众直接问了这个尖锐的问题:如果未来真的出现全生命周期的 UGC 生态,机构会不会被边缘化? 周志鹏的回答很清晰:未来的世界更像一个平的网状结构,而不是拥有巨大烟囱工厂的金字塔。 平台仍然掌握流量入口——这一点短期不会改变;机构则从生产车间变成基础设施:提供能力,把多年积累的经验拆成对创作者友好的工具和模板;提供知识库,把案例、踩坑经验、成功路径沉淀下来,供无数创作者调用;提供协作支持,让天南海北的创作者能保持画风统一、角色一致、出品质量可控。 柴雯从传统影视出发,也得出了类似结论:AI 会解决大量技术门槛,但资源整合、经验沉淀、品牌长期经营这些能力,依然需要机构来承担。 她更愿意把自己团队,看成一个核心经验的节点,在这个节点之上,可以接入更多共创者,反复产出高质量内容。 埋云则把门开得更大:哪怕你不会画画,只要愿意拥抱 AI、愿意创作,只要有审美和足够多的看片量,都可以进来。 但他同时提醒,导演思维和剪辑思维看起来好像好学、可被替代,可真正好的导演,普通人还是望尘莫及。 换句话说,AI 可以在横向上大幅拉平技能差距,但在纵向上,顶层高手的高度依然存在。 机构不会消失,它只是从权力中心,退到支撑每一个超级个体的地基位置。 五、AI 漫剧会不会诞生下一个《西游记》? 现场观众抛出了现场最浪漫、也最现实的问题:这个赛道会不会出现一部,像《西游记》、金庸小说那样,承载一代人记忆的全民爆款? 埋云的态度是谨慎乐观。如果从更大的维度看,他认为全民爆款应该从AI 影视的角度去判断,而不是只盯着漫剧这个子类型。 现在 AI 二维的技术已经相对成熟,但要做出类似《哪吒》级别的全民现象,还需要几年时间。 他只能说有希望,但还看不到具体的形态。 柴雯则更果断,她认为出爆款是必然的,只是形态会被拆成三个梯队。 最底层,是海量的快消内容,解决大量用户对内容的娱乐性诉求; 中间层,是各个垂类的高质量内容,慢慢积累固定且重视的粉丝和受众,沉淀出品牌影响力; 最顶层,是极少数的旷世杰作,它们不只是好看,而是成为一代人的回忆,贯穿着他们共同的成长过程,就像《西游记》。 这三层,不可能靠同一套机制诞生,也不可能由同一批人完成。它们需要的是不同的生态:有人负责快速试错,有人负责长期打磨,有人负责把这件事做到极致。 周志鹏则泼了一点冷水:先别急着期待下一个《西游记》。 一方面,中国的二次元文化基础,与日韩完全不同,本身就是相对小众; 另一方面,当前 AI 漫剧主打的核心用户,是爽剧人群,是偏快消的需求。 在这个阶段,漫剧的价值更多还停留在短期爆发的商业回报,很难支撑真正长线的 IP 价值。 他给出的判断是:真正能诞生划时代 IP的那一刻,一定是在 AI 能力升级到影视级重磅制作之后,当 AI 不仅能把画面做得足够好,还能支撑超级复杂的叙事与人物成长时,那个时代的全民爆款,才会真正出现。 所以今天的 AI 动态漫,更像一条通往未来的大路上的前哨站:一边在帮行业试探各种新的内容结构;一边在用无数部小作品,训练一个更大、更深的叙事引擎。 六、为什么现在,是加入 AI 动态漫的最好时刻? 如果你是机构,这个赛道给你的提醒是:别再幻想再造一个大工厂,更现实的选择,是去成为新的基础设施。用产品化的能力,为成千上万的创作者供能。 如果你是创作者,无论是编剧、导演、漫画作者,还是刚刚开始摸 AI 工具的个人用户,这个时代给你的礼物是:技法正在被快速拉平,真正拉开差距的,反而是你对故事、对人、对时代的理解。 会不会 LoRA,不再是决定你能不能进场的门槛;你有没有想清楚我到底想表达什么,才是新的分水岭。 如果你是平台,你真正需要思考的,也许不是扶持多少部剧,而是:如何设计更精细的流量机制,让那些真正有表达欲、有持续迭代能力的人被看见,而不是简单地把流量砸在几部能带货的爽剧上。 如果你只是一个普通观众,今天的你,几乎已经可以从被喂养内容的人,变成可以自己写一点的人。 你未必要做一部长片,一支 30 秒的小故事,也足以在这个生态里留下痕迹。 在这个意义上,AI 动态漫带来的真正升级,不是画面清晰度从 1080P 到 4K,而是表达清晰度的升级。 从我有很多感受,却说不出来,到我终于可以把脑海里的画面,一点点搬到屏幕上。 技术会继续迭代,工具会一代代更新,平台的政策会变,风口也会变。 唯一相对稳定的是:人类对故事的渴望,从来没有减少过。 AI 不会替你讲故事,它只是在悄悄拆掉你和故事之间,那堵过于厚重的墙。 如果你脑子里已经有一格画面、一句台词、一个角色, 也许,今天就是你走进 AI 动态漫世界的最好起点。
AI创作这件事正在滑向每个人的日常?|对话智谱、生数、爱诗、Sand.ai本次对话发生在由非凡产研主办的「2025年度AI创造者高峰论坛暨CHINA AI 100 & AI Creators 100年度评选」的第一场圆桌论坛,【星程314】栏目的主持人,非凡资本合伙人Abner担任本场圆桌论坛的主持人,圆桌论坛的嘉宾分别是:智谱高级副总裁Richard 吴玮杰,爱诗科技B端负责人 孙伟哲,生数科技/Vidu 副总裁 王川,以及 Sand.ai Chris 苏果立。 如果说过去一百年,影像的门票一直握在少数人手里,那 2025 年开始,这张门票正在被重新打印,而且是按每个人一份的规模印。 在北京2025非凡大赏的这场 Panel上,讨论的主题很直白:AI 时代的创造者会是谁?视频大模型会把内容产业推向哪里? 坐在台上的四位嘉宾,刚好代表了这股浪潮最硬的四条支流: 智谱高级副总裁Richard 吴玮杰,爱诗科技B端负责人 孙伟哲,生数科技/Vidu 副总裁 王川,以及 Sand.ai Chris 苏果立;主持人是非凡资本合伙人 赵亮。 他们不是在聊趋势,而是在掰开给你看:当 Sora 2 把视频模型的能力抬到新高度之后,创作这件事,究竟会从专业工厂,滑向每个人的日常? ------------ 一、四个Aha Moment,其实指向同一件事 主持人Abner的问题很直接:你们什么时候被 AI 戳中,从此就下了场? Chris说的不是某个炫技 demo,而是 GPT-4o 的一个更深层的启发: 模型正在从工具箱变成内建能力。 过去做产品像搭积木:语言模型、图像模型、工作流、插件,一块块拼起来。GPT-4o 的生图给他的震撼是:那些原本要靠工作流串起来的复杂操作,被折叠进了模型本体里。 于是模型即产品不再是一句口号,而是一道研发的反问句: 这个功能,到底应该写在产品里,还是训练在模型里? 王川的心动时刻来自 Sora 1。理由也很朴素: 视频终于不再像概念片,而像现实。 他看到的不止是以假乱真,更是产业面的震动:互动娱乐、电商、教育、游戏……几乎每个行业都能被视频模型重新开一遍门。 对他来说,加入浪潮的初心是把前沿技术长到真实生产里——不是让技术上墙,而是让客户的工厂、课堂、直播间都能用得上。 老孙有两个瞬间,一个是 ChatGPT 把他拽进 AI;另一个更关键,是变身特效的模板上线后让 PixVerse 一个月长出千万级用户。 他从这个裂变里看到的是: 真正的拐点,不是技术多强,而是门槛有多低。 ChatGPT 不是最强模型,但它让普通人也能用;模板化封装提示词,把视频 AIGC 从高手的玩具变成了全民的语言。 那一刻,在爱诗科技把它叫做视频 AIGC 的 GPT 时刻。 Richard(智谱)没有浪漫的闪光灯,只有一个现实的判断: 这是个已经能自己跑起来的赛道。 在2023年,Sora 还没发布时,智谱就已经在技术和商业化上做出了不俗的成绩。 他用一句玩笑总结自己的决策方法:既然重回科技赛道,要搞就搞最前沿的大模型。 听起来轻松,但背后是把趋势、团队与落地能力算了一遍后的理性下注。 二、当模型开始脑补,创作关系被改写 Chris 提了一个很有画面感的判断:Sora 2 给视频模型换了一种解法。 以前的路线是追指标:清晰度、运动质量、镜头稳定、时长一致性……像在考试。 Sora 2 更像在学懂你:你只需要描述意图,模型去补完细节,甚至主动替你建构呈现方式。 这背后的变化是:人从执行者变成导演。 导演不必自己扛机器、打光、剪辑、配乐;他只需要不断给反馈: 好还是不好? 这里再快一点。 别那么煽情。 AI 负责把导演的意图变成镜头语言。 换句话说,模型越会脑补,人就越像在做高层决策。 创作从体力活变成审美与选择。 而审美这种东西,恰恰每个人都有一点,只是以前缺一台能听懂你的摄像机。 三. AI 创造者到底是谁?答案比你想的更大 这一段讨论特别有意思,因为它把创造者从一个小圈子,拆成了一个社会级的新身份。 Richard 把智谱的创造者分成三种生态: 大型组织里的业务创造者:比如城市公交、能源、应急的普通员工。他们每天通过模型做服务优化,本质上也是在生产新价值。以前我们叫他们岗位人员,现在更像用 AI 重新定义岗位的人。 互联网高科技公司里的工程创造者:国内头部互联网公司在模型生态里形成了集体创作——一群人用模型把业务重新写一遍,从而优化用户体验,提要整体效率。 个人开发者:GLM Coding 套餐在发布后的几个月内付费订阅数量激增,说明一件事:代码正在成为新的创作语言,而且门槛在下降。 更有冲击力的是,他提了一人公司创业计划。 目标不是让每个人都成创业明星,而是让更多人能试一次靠 AI 打开新生计。 哪怕100万个一人企业中最后只有 1000 家跑出来,有投资价值的只有10 家,也足够让这 100 万人学会与 AI 相处,能更好地推动他们的就业技能,减少焦虑情绪。 老孙的分类更像创作生活史: 超级创作者是弄潮儿。他们像多模态时代的 DJ:LLM、TTS、视频模型混起来,拼出新的工作流。PixVerse 给他们能力,也给他们舞台(电影节、赛事)。他讲的超级个体艺术家的故事很重:一个人遇到挫折,靠着对艺术的理解和热爱,还有 PixVerse 再次回到职业舞台。技术不是让人躺平,而是让人重新站起来。 普通创作者是每个人。你上传一张图、写几句话,就能得到含声音、字幕、封面的一站式故事。以前每个人都是生活的导演是口号,现在真的开始变成产品能力。 王川把 AI 创作者写成了三个关键词:效率、混合、全球化。 一周剪一个月的工作量; 多模态工具混用; 从第一天就考虑出海。 这三件事合在一起,就是一个新的创作生产函数——时间、工具、市场边界同时被折叠。 所以你会发现,AI 创造者的边界越来越像氧气: 不是一个行业,而是一种生存方式。 四. 漫剧为什么火?因为它站在更高Beta 的地方 漫剧(AI 动画短剧)这段讨论也很河流视角。 Chris 说漫剧是短剧里更高 Beta 的子类。 原因不复杂:短剧预算有限,拍不出超现实大场面; 而漫剧用 AI 生图/动漫形态,天然适配想象力超车。 于是一个新的可能出现,一个人一部片的超创时代。 当视频模型每 3-6 个月发生一次范式级变化,爱诗两年迭代了八个版本的模型,未来的超级创作者可能会用一个模型栈做出不输传统工业的现实题材作品。 那时短剧产业的爆发,不是量的增长,而是质感阈值被打穿。 王川则更务实:Vidu 在漫剧行业已经覆盖了 70% 头部工作室。 他给出的关键能力是: * 时长/节奏控制(1 到 10 秒可控) * 人物表情强(哭、笑更自然) * 一致性稳(角色不变脸) 更重要的是,他讲了两派工作流: 图生视频链路:剧本→分镜→生图→动效 参考生视频(Reference-to-Video):先建角色库/道具库/场景库,再一句话生成视频 第二种更像数字实拍,它正在把漫剧从拼图升级成拍片。 他最后留下一个悬念: 漫剧真正的变量,可能不是画面更好,而是新的娱乐态势,实时交互。 从单向剧变成你能参与、你能改、你能跟角色对话的活内容。 五. 实时交互什么时候来?答案藏在架构里 这一问一答是全场最有未来感的部分。 Chris 解释了 Sand.ai 为什么走自回归路线:Diffusion 生成视频要等所有帧出来才能看;自回归可以像水一样边生成边播放。 当粒度从 1 秒压到 1 帧,实时互动就从概念落到工程。 他甚至给了个非常具体的时间锚点: 2025 年下半年就会看到苗头。 注意这不是一句未来会有,而是一个研发路线对市场形态的提前下注: 架构决定交互形态,交互形态决定新内容产业。 换句话说,你今天选择的模型路线,可能就是明天娱乐世界的物理规则。 结尾:创作这件事,正在从努力变成自然 这场 panel 听完,有一种很强的共识在底层流动: 视频模型不是在做更会生成的视频,而是在做更懂人类表达的介质。 当模型原生具备更多能力,人就把精力从怎么做转向做什么、为什么做; 当门槛继续被压低,创作就从少数人的职业变成多数人的日常; 当实时交互到来,内容不再是成品,而是可以一起生长的生命体。 也许几年后,我们回头看今天的漫剧、特效、短视频,会像回头看早期的短视频平台: 它们都只是一个信号, 创造权正在下放。 不是AI 取代创作者。 而是AI 把创作还给更多人。
来自硅谷的AI数据科学家创办了一家“元气”公司|访谈AI健康管理创业公司Omni创始人【本期嘉宾介绍】 孙朝南(Jony),元念科技(Omni Health)创始人。南京大学本科,莱斯大学硕士,一位在硅谷顶尖科技公司(LinkedIn、Uber)深耕近十年的数据科学家。在职业巅峰期,他选择了一条“反向迁徙”之路:离开硅谷,回国加入腾讯,而后再度离开,投身创业浪潮。他创立的元念科技,专注于将AI与大健康管理深度融合,其首款标志性产品——一款旨在让人“元气满满”的智能戒指,正是他技术理想与商业洞察的结晶。在本期对话中,他将毫无保留地分享从硅谷精英到健康赛道创业者的心路历程、关键决策背后的思考,以及对AI赋能健康未来的大胆预言。 【你将听到】 Part 1 一个硅谷数据科学家的“反向迁徙” 05:53 从Linkedin到Uber:硅谷的“黑客精神”,如何影响他的管理哲学? 10:08 为何在巅峰期离开Uber、腾讯,选择创业? 11:08 一次关键的赛道选择:放弃大模型数据基建,All in AI+健康 Part 2 为何赌“智能戒指”是下一个“2015年的智能手环”? 14:18 巨头入局的信号:在OpenAI、谷歌布局的赛道,创业公司的机会在哪里? 17:04 “脏活累活”的价值论:为什么说细分赛道的深度运营是初创公司的护城河? 18:59 AI健康的两大痛点突破:如何用“洞察”与“陪伴”解决传统健康管理的死结? 21:53 为什么是智能戒指,而不是智能手表? 22:56 信任难题:当AI给你开健康处方,如何确保它可信、可靠、可解释? 25:11 来自创始人的“自白”:智能戒指如何提前预警了他自己的一次生病? 29:24 产品哲学之争:是“功能硬件”还是“情感载体”?智能戒指的“情绪价值”论 32:29 这一天并不远:AI大模型与人类时序健康数据产生“涌现” 37:33 商业模式双轮驱动:硬件是入口,软件是服务,如何相互转化与赋能? 41:32 “软件的用户数量可能会10倍于硬件的用户数量” 46:21 一个大胆的跨界猜想:AI健康管理与中医的“经验主义”,底层逻辑是否相通? Part 3 “现在可能就是我们这辈子能碰到的最好的创业时机了” 48:53 为何不在硅谷创业? 52:47 创业的最大挑战:不是技术,而是管理人性 54:31 想象自己是马斯克:面对不确定性,如何靠“直觉”做出关键选择? 56:34 创业心法:比起理性复盘,舒服、自洽可能更重要 58:46 “元气”背后的野心:定义下一代健康管理的“动词” 01:00:27 平衡的奢侈:一个健康管理公司创始人,如何管理自己的时间与“元气”?
曾经的“超级黑客”要用AI重构行业并且大赚特赚|访谈AI创业者-万径安全创始人2:30 Q1:司总您好,作为一名技术背景的CEO,您个人目前使用最多的AI工具是什么? 司红星: 我现在还是偏技术多一点,所以日常用的多是和AI软件开发相关的一些Agent 。具体来讲,Cursor是我用的最多的 ,其次是Claude Code 。之后就是国内的一些AI coding工具 。像AI写PPT这种倒不怎么用了,因为发现大家做的都不是太好 。 05:17 Q2:万径安全的核心技术之一是自研了编程语言YAK,为什么在AI时代还要做这么底层的事情? 司红星: 这是因为网络安全行业此前的工具是完全割裂的 。大家基于Python、Go、C、Java等各种语言写工具,导致AI作为“大脑”时,很难去调度这些零散的“手和脚”,效果非常差 。 我们从2019年开始做,2021年发布了YAK 。它将网络安全底层的能力全部融合到一起,AI只需要调度这一个统一的基础设施,就能更好地解决攻击和防护问题,推动整个行业向智能化转型 。 08:32 Q3:万径安全是什么时候开始探索AI Agent的?经历了怎样的技术路径演进? 司红星: 我们很早就开始探索了。 2022年: 第一次用ChatGPT 3.5时,感觉我们这个行业要完了,它甚至能学会写YAK语言 。 2023年: 我们在2023年5月30日发布了第一个网络安全大模型Chat CS 。但当时本质上还是Chat(问答),无法“执行” 。 2024年: 当时行业流行Workflow(工作流),我们发现Workflow最多能解决“自动化”,无法解决“智能化”和“自我驱动”的问题 。 2024年底-2025年: 受到了Devin和Cursor的启发 ,发现“端到端的Agent”这条路,比Workflow要靠谱多了 ,于是开始研发现在的原型。 14:28 Q4:在网络安全领域应用AI Agent,你们遇到的最大技术挑战是什么? 司红星: 主要是两大挑战:无限上下文和超复杂任务 。 超长上下文: 比如分析一个攻击日志,文件可能有1G或2G 。现在的大模型(如128K或两兆)是肯定会爆掉的 。 超复杂任务: 网络安全(特别是攻击)有很强的不确定性,你进入下一步之前,不知道后面会遇到什么 。这导致你无法像很多任务一样提前规划好所有步骤 。 15:41 Q5:针对超长上下文和超复杂任务,万径安全的Agent框架是如何解决的? 司红星: 业界的Agent模型主要有ReAct(做一步看一步)和Plan and Execution(先规划十步再执行) 。网络安全领域是这两者的结合:大的攻击流程可以“规划”,但每个细节又需要“ReAct” 。 我们的解决方法也很粗暴 : Summarize(总结) 和切片(Slicing) 。 最关键的是,通过工程手段,让所有的ReAct过程都去共享一个记忆(memory)或缓存(cache) 。这样,我们就能处理几百兆甚至一个G的日志分析 。 19:19 Q6:你们提到传统的RAG(检索增强生成)也不太好用,你们做了哪些改进? 司红星: 传统的RAG就是简单的切片和向量检索,会把原来的语义切掉,检索出来的片段不一定真的有意义 。我们想要的是“语义级别”的检索,可能原文里没有这句话,但AI需要理解这个语义 。 我们的改进包括: 变被动为主动: 我们做“知识萃取”,让AI主动去学习Word、PDF甚至视频音频,萃取知识 。 语义向量: 我们用了千问3的Embedding模型来做语义级别的向量存储 。 自研数据库: 我们没有用大型的向量数据库,而是自研了一个轻量级的、类似SQLite的本地向量数据库,让Agent在笔记本上就能跑起来 。 43:00 Q7:客户愿意为这些AI功能额外付费吗?AI为万径安全带来了多少实际收入? 司红星: 这个肯定是的 。我们预计,今年(2025年)由AI带来的新增营收大概在两三千万 。明年(2026年)可能会更多,因为我们的基础设施做完后,在安全行业里是没有(同类产品)的 。 46:00 Q8:这两三千万的AI收入具体来自客户的哪些需求? 司红星: 大概分成两块 : 科技研究类: 比如研究如何让Agent变得更好,或者研究AI写了很多代码,如何保障这些代码的安全性 。这种一个项目大概几百万 。 Agent产品类: 告警降噪: 客户一天有1万条告警,人工处理不过来,让AI来处理真假告警 。 数字人产品: 在笔记本里提供一个类似Cursor的工具,辅助客户完成日志分析、流量分析等日常任务 。 AI智能渗透: 即AI主动挖掘漏洞 。这个产品虽然我们自己只打了30分,但已经比原来投入大量人力要靠谱 。这个产品今年(2025年)就有小1000万的收入 。 27:39 Q9:司总如何看待“越通用越没用,越聚焦越有效”这个说法?你们的Agent是通用的还是专业的? 司红星: 我很认同“越通用越没用” 。比如AI coding工具,在简单的CTF题上能做,稍微复杂一点就不行了 。 我们的目标就是做一个网络安全领域的AI Agent 。我们会非常看重客户提的那些“看起来很简单”的真实诉求 。哪怕我们五分钟就写完了,但以前我们(创业者)很难想到客户会为这个点买单 。把这些真实的、很小的点先做好,再叠加起来,是比较靠谱的路 。 56:08 Q10:万径安全选择自研“YAK”语言,在融资过程中顺利吗? 司红星:绝大部分投资人都是不认可的 。 在2022年、2023年融资时,很多人问我:“这个东西为什么诞生在中国?你们对标美国的谁?” 。我花了很多精力去解释逻辑,后来就放弃了 。 到2024年,我就可以告诉他们:“别问我为什么是他们不是我们了,我做出来了” 。我会反问投资人:“为什么我们不能从0到1?” 。我很感谢现在的投资人,他们是有共同信仰的 。 44:00 Q11:司总如何看待网络安全行业的未来? 司红星: AI发展太快了,我去年(2024年)还在聊Workflow,今年Agent就能做这么多事了 。我相信过不了几年,AI在网安领域就能达到80分甚至100分 。我心目中的100分,是未来的攻防都走向智能化和无人化 。 1:02:19 万径安全的最终目标是什么? 我们的目标就是继续沿着“AI + YAK”这条线走下去 ,让这个国家网络安全的从业人员能用我们的东西,抛开原来的“缝合怪”,做出原生、好的产品 。当然,我们也不只看国内,我们还是想去跟国际上的头部玩家去碰一碰,和他们同台竞技 。