Highlight
「AI短剧的爆发,对应的可能是我们会迎来一种所谓的想象力经济的到来」
「未来软件只有两条路可走,一是加快增长,创造出新的产品且增长速度超过10个点;二是多挣钱,把公司的净利润率提高到40%以上。否则在12 - 18个月内公司可能会面临困境」
分享了 AI 行业的最新动态、前沿项目、工具应用以及行业面临的挑战与应对策略,内容如下:
- AI 行业趋势
- 两条发展道路:扎克伯格提出未来软件公司只有两条路可走,一是创造新产品,使增长速度超过 10%;二是提高公司净利润率到 40%以上(包括股权激励部分)。如果在 12 - 18 个月内不选择这两条路,公司可能面临困境。
- 具体实施建议:对于创造新产品的路径,建议找到公司内部的百倍工程师组成五人小团队,关注高价值工作流,构建动态上下文,将 50%的研发资源投入新产品。同时,要精简 VP 团队,让优秀产品经理多接触客户,核心工程师留在总部迭代核心架构。对于提高利润率的路径,建议大幅提高每个工程师的 TOKEN 预算,为大规模裁员做好准备。
- 评估框架与维度:黄仁勋提出已到 AGI 阶段,但冯小平认为需要对 AGI 进行评测。他介绍了 deep mind 17 号发布的文章,引入了 AGI 的认知框架(cognitive framework),将通用智能分为感知(perception)、生成、注意力(attention)、学习、推理(reasoning)、元认知(Meta cognition)、执行任务、解决问题、社会认知等维度。
- Kaggle 比赛:Kaggle 举办了 “measuring progress towards AGI” 比赛,奖金共 10 万刀,每个 track 有 2 万刀。比赛旨在让参赛者创建评估学习能力、元认知、注意力、执行能力和社会认知等维度的 Benchmark,利用 Kagle 1 月份上线的社区驱动评估项目。
- 技术发展与政策治理脱节:他还提到,经济日报文章讨论了 AI 短剧是否能替代真人短剧,指出过度追求效率可能导致品质降低。同时,软件版权登记制度要求明确未使用 AI 开发编写的代码,但实际上新的 AI 厂商大多已使用 AI 写代码,这表明技术发展远超政策治理的想象。
- 漫改剧消耗增长:冯小平指出,字节漫改剧消耗在近一两天内超过真人短剧,日均消耗无论是按分钟计算还是费用计算都有显著提升。这一现象反映出漫剧作为特定 AI 生成剧的崛起,也预示着利用 AIGC 工具释放人们想象力的领域将快速发展,如生成小说、游戏、剧情等,可能迎来想象力经济。
- 想象力经济到来
- AGI 评估
- 软件公司发展路径
- 前沿项目与研究
- 项目启动与规则:本周 RKGI3 正式启动,界面有给人类和 AI 的两个入口。游戏类似游戏机,玩家控制上下左右移动,通过让左下角图案变成最终目标图案并走到终点获胜,但游戏未明确过关规则,玩家需自行探索。
- 模型表现:目前人类最高得分 100 分,步数 546 步,最牛的模型 GPT 5.4 得 0 分,跑了 100 多步。不过已有玩家刷到 20 多分,该项目对模型提出了挑战。
- 部门成立与研究方向:Lequand 的世界模型 2.1 版本持续迭代,同时成立了 Anthropic Institute,专门研究人工智能对人类社会的挑战。该组织分为三个团队,分别研究 AI 对网络安全、社会(包括经济、工作等)和法律体系的影响。
- 国内借鉴意义:冯小平认为国内模型公司和政府单位应设立相应部门,开展相关研究。
- 推理过程分析:研究发现视频生成模型的推理过程并非一帧一帧串联,而是采用一步一步的链(chain of steps),是并发或平行探索的过程。例如,生成机器人走迷宫、放置绿植、玩 TIC TAC TOE 游戏等视频时,模型会进行普适探索,最后生成确定性结果。
- 模型推理能力:通过对视频生成模型的深度分析,发现其具有较强的推理能力,且推理过程有轨迹可循,可归类于模型可解释性研究。
- AI scientist 与辛卡纳:AI scientist 和辛卡纳(Xin Kanna)致力于通过模型驱动的 agent 探索科研成果,辛卡纳采用基于进化算法的过程实现自我迭代。但以往主要关注算法 solution 的迭代,而寻找 solution 的方法变化不大。
- Evolvex 与 Hyper agent:Evolvex 和 Hyper agent 不仅迭代 solution,还迭代生成策略,实现算法探索方法的自我进化。AI scientist 相关研究登上 nature 主刊,表明 AI 自我研究有很大突破,建议在校同学关注该方向。
- 项目介绍:冯小平推荐大家观看特斯拉 Terrafab 的视频,视频时长约 20 分钟,内容有流浪地球的格局。该项目与马斯克的产业相关,提到了卡达谢夫指数,马斯克集团旨在帮助人类在该指数上爬升。
- 发展规划:项目计划开发 AI 5、AI 6 芯片用于端侧模型,D3 芯片用于太空,具备防辐射和散热能力。还将通过 Spacex 火箭发射 10 千瓦级别的算力中心,最终实现 1 T 瓦级别的算力,这相当于美国当前发电量的两倍。目前特斯拉招聘网站上有 Terrafab 的招聘信息,包括流程、晶圆、工艺和项目管理等岗位。
- 特斯拉 Terrafab
- AI 自我进化研究
- 视频生成模型
- Anthropic Institute
- RKGI3
- 工具与技术应用
- 功能与优势:Openai 和 Claude 推出了 tool search 接口,开发者将完整的工具提供给模型,并设置部分工具为延迟加载,可节省大量 TOKEN。当需要使用工具时,tool search 会帮助选择适合的工具。
- 行业影响:这一功能可能会对传统的工具管理行业造成冲击,如 Compass io 这类公司的业务可能会受到影响,提醒开发者不要与大模型厂商对着干。
- 产品功能:Blueprint 是一个生成硬件产品的 agent,用户输入需求后,它会询问相关问题,如传感器类型、通信链路等,然后生成 BOM(物料清单)、渲染图、连接方式和 3D Mesh,并提供构建指南。
- 成本优势:有用户使用 Blueprint 构建的硬件比 Openhome 便宜 10 倍,展示了其在 Web 硬件领域的应用潜力,结合之前的生成 PCB 项目,深圳在 Web 硬件方面有很大的想象空间。
- 逆向结果:阿里的悟空被逆向,逆向结果显示了系统架构、开发语言环境、代码结构以及对应的可能功能,还能生成总的架构图。分析认为其大概率不是用 Openclaw 修改的,因为采用了 rust 语言编写。
- 行业影响:这表明软件秘密越来越难保守,企业业务壁垒不应仅依赖 APP 或技能,需要寻找新的竞争优势。
- 功能特点:open Oak 原名 open Granola,是一个系统监控的开源项目。开启该应用后,它会收集系统声音和麦克风声音,实时转成文字,并通过本地文件查找与当前讨论内容相关的文本,呈现在界面上。
- 应用场景:可用于面试作弊或文案辅助,在销售等过程中能快速获取相关信息。
- open Oak
- 悟空逆向
- Blueprint
- tool search 接口
- 其他研究与项目
- Openhome 项目:Openhome 用树莓派驱动喇叭和麦克风,用户可根据需求开发应用。例如,当监测到婴儿啼哭时,使用 Google 的 Lyria 3 模型生成 30 秒摇篮曲进行安抚。该项目展示了通用硬件加 agent 在完成应用场景开发方面的潜力。
- Flash kmeans 算法:Flash kmeans 算法将 kmeans 聚类算法在 GPU 上的加速提高了约 30 倍,是软硬件协同设计的典型案例。其方法可应用于其他类似算法,如 charge Boost,通过减少存储级别的冲突,提高了算法效率。
- Chroma 模型:Chroma 向量数据库开发的 context one 模型,将 agentic retriever 部分模型化,提高了使用该模型进行 agentic retriever 的效率和准确率,适合做 RAG 类型系统交付的同学考虑。
- Tribe VR 模型:Meta 开发的 Tribe VR 模型将人类大脑建模,能根据声音预测大脑的活动区域。该模型比 V1 有更强的泛化能力,可将声音与脑区活动范围进行映射,为研究声音与大脑的关系提供了参考。
- per Turb AI 模型:per Turb AI 公司隐身很久后推出的模型,用于预测基因编辑后小鼠大脑 800 万个细胞的变化。该研究可应用于基因治疗,特别是针对脑部肿瘤等难题的突破。
- Claw Institute 平台:Claw Institute 创建了一个专门为 AI 研究员提供交流和讨论的平台,类似于 AI for science 版的 MOOC。平台通过持续的 ai agent 研究流程,让多个 agent 讨论、使用工具、迭代研究内容,最终形成有价值的科研成果,比之前的 Morebook 更有明确价值。
- Spell APP:Spell APP 是一款游戏产品,核心观点是提示词辜负了用户,因为大部分人不知道如何打出好的内容。该 APP 将提示词变成类似于富文本的形态,包含动态的小 block、视频、可交互组件和小图标等,丰富了用户与 AI 对话的方式,为应用开发的 UI 突破提供了灵感。
- 行业挑战与应对
- 软件秘密保守:悟空被逆向的案例表明,软件秘密越来越难保守,企业需要寻找新的业务壁垒,不能仅依赖 APP 或技能。
- 网络攻击风险:Lite LLM 库被攻击事件显示,网络攻击风险远超想象,Web coding 人员都能进行深度的供应链投毒。Future search 公司通过发现漏洞揪出了攻击事件,该公司提供研究员服务,根据任务组成合适的研究团队,未来可能会出现更多类似卖人类能力的公司。
- 技术栈选择:PHP 系统迁移的案例说明,在 AI 能很好地迁移各种语言的情况下,技术栈或使用的语言不再那么重要,新一代架构师应关注其他方面。
- 课程与项目推荐
- SRB 课程:程沐凡推荐大家观看 SRB 刚出的 agent skills 课程,认为官方出品值得关注。
- Mistral 项目:Mistral 项目用于自动化测试,用户可通过写 shim 的方式指定任务,如打开应用、搜索探索等,无需指定按钮位置,agent 会自动完成测试。结合开放测试平台,可在所有测试设备上完成自动化和黑盒测试,未来测试工程师的工作方式可能会发生改变。

