


和前《原神》主创恶少聊AI游戏创业|“这一次,我要做个游戏圈的‘渣男’”🎉 节目开始前:感谢朋友们的支持,我们拿奖啦!会继续努力的!🎉 🚥 本周「十字路口」的嘉宾是恶少。 在游戏行业,恶少曾经可谓站在行业巅峰,作为最早的策划,他参与创造了《原神》这一现象级游戏。 最近,他选择创业——为什么会在所有人以为他到达“罗马”时选择离开?面对今天的中国游戏行业,他为何给出了“一潭死水”的犀利评价? 本周的「十字路口」,我们邀请到前米哈游《原神》的恶少,将带我们回到那些知名项目立项的早期时刻,用他当时作为参与者的视角,还原他们如何用几块钱的塑料板凳和对极致的偏执,在这个时代留下了浓墨重彩的一笔。 同时,作为一名投身 AI 浪潮并发布了新产品 Krene 的创业者,他也在播客里分享了为什么再创业,AI 在解决游戏行业“跨领域协同”难题的作用,以及他想要如何通过工具,帮助下一代年轻人创造出属于他们的《原神》。 🎬 我们的视频播客来啦!本期播客在上海漕河泾 AI Hacker House 内录制。将随后上线于 @Koji杨远骋 的视频号、小红书、哔哩哔哩、Youtube 等平台。 📒 文字版将随后发布于 @十字路口Crossing 公众号。 🟢 01:08 快问快答:年龄、毕业院校、MBTI、星座、一句话介绍现在的公司和产品、团队规模、创业前经历。 🟢 02:08 游戏行业的“Wow Moment”与厚积薄发 为什么最近沉迷一款老游戏《信长之野望:创造》,它让我想到了 AI 的奇点时刻。 * 现在的很多新游戏被舆论情绪裹挟 * 经过时代洗礼的老游戏中,能看到最纯粹的设计精华 * 老游戏会打折 * 游戏行业的爆发往往不是线性的,它需要一个积累过程,然后突然以惊人的方式涌现。 🟢 03:45 米哈游往事:塑料板凳与工业化奇迹 当初看到《崩坏3》的 Demo 时,我的第一反应是:“天呐,这项目要完蛋,能不能熬过三年?” * “技术宅拯救世界”的解读:米哈游“追求极致”文化的实体象征——为了抠一个像素的细节,美术直接搬个地摊小板凳坐在策划背后改,一坐就是几小时。 * 重新定义公司:入职第一天创始人就告诉我,“米哈游不是一家游戏公司,而是一家 ACG 公司”。 * 《原神》立项之初:想做开放世界,但不知道内核是什么。 * 核心玩法的突破:在一个小黑屋里憋出来的“Wow Moment”,以“元素交互”为核心玩法的开发方向。 🟢 16:56 个人蜕变:从“明星设计师”到“幕后架构师” * 最痛苦的瓶颈期:我想亲自抠每一个细节,却成了团队成长的天花板。 * 创立一个新团队:为了像特种兵一样解决问题,必须从前台退到幕后,铺路、搭框架。 * 为什么《原神》敢挑战“全球同步、全平台数据互通、42天一更新”这种行业从未有过的地狱难度? * 工业化的真相:SOP(标准作业程序)往往是扼杀创造力的阻碍,用技术(Sandbox 沙盒机制)来解耦团队,让创作自由与工业化并存。 🟢 34:42 为爱买单:内容行业的商业模式哲学 * 为什么二次元商业模式能成功?因为卖的不是数值、不是对抗,而是角色与故事的情感连接(Pay for Love)。 * 真正的工业化不是把人变成机器,而是让几百个团队并行工作,最终却能在同一个世界里无缝融合。 * 游戏行业的规律:伟大往往不能被计划。很多顶级公司的创始人最初只是同人画师、Mod 作者,纯粹为了“爱”而创作。 🟢 45:10 创业抉择:现在我更想做一个“渣男” 我曾经想做聚光灯下的明星制作人,但现在我更想做一个“渣男”——我想参与到成千上万个优秀游戏的创作中去。 * 为什么离开米哈游创业?看到中国游戏行业除了头部,大部分是一潭死水——大家在模仿工业化的“形”,却磨灭了灵感的“火种”。 * Krene 的产品野心:不仅是做游戏,而是做“互动内容”的架构师。 * AI 的核心价值:降本增效只是表皮,AI 真正解决的是“跨学科协同”的痛点——让一个不懂代码的美术,或者不懂美术的程序员,也能一个人做出一款游戏。 🟢 01:06:05 世代洞察:Z 世代为什么更爱“单机”? * 80/90后成长于匮乏时代,渴望在 MMO 里社交、当帮主、呼朋引伴; * 00/10后生于信息过载的互联网,他们反而产生信息恐慌,更倾向于在“单机”或极度垂直的小圈子(如 SCP、怪核)中寻找共鸣。 * 未来的内容形态:电影和游戏的界限将消失,最终融合为一种高沉浸、可交互的“互动内容”。 🟢 01:16:25 表情包管理学与 ISTP 的自我修养 * 从米哈游带走的最宝贵资产竟然是——硬盘里那堆记录了项目 Bug 和名场面的表情包。 * 情绪复盘法:作为 ISTP,每次产生情绪(无论积极消极)都会“灵魂出窍”去分析它。团队的焦虑往往是系统性风险的早期信号。 * 游戏寻根:我认为所有现代游戏的灵感起源只有两个“爹妈”——《沙丘》(Dune)和《指环王》(LOTR)。 🟢 01:26:36 终极一问:如果有 300 万美金做投资,我会怎么投? * 我会 All-in 投给我的一位大学同学,他在做“人工毛囊”。 * 这不仅是解决脱发问题,更是解决人类几千年来的外貌焦虑。 欢迎订阅「十字路口」: 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我创办了十字路口,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间,在真格基金担任 Venture Partner(投资合伙人)。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我联合创办了十字路口,在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 的即刻
你的下一个可穿戴设备,是挂脖子上的健康伙伴?| 对谈潘宇扬:AI项链Odyss创始人&李一豪:CreekStone合伙人AI 硬件的领域,永远有新机会,也永远都有大量野心满满的创业者。 本周,十字路口请到潘宇扬 Chris,他是字节跳动 Coze 最早的产品经理,也负责过字节等公司的 AI 眼镜项目。宇扬今天带着他创业做的产品 AI 项链 Odyss 来到十字路口。同时我们还请到了他的天使投资人,来自 CreekStone 的合伙人李一豪。 (产品图:Odyss AI 项链) 在本期播客中,我们深入探讨了宇扬的“非共识”创业之路。作为一个深度参与过 AI 眼镜项目的人,他为什么最终放弃了这条热门赛道,认为它更像是“2015 年的 VR”?同时,宇扬分享了他如何选择“项链”这一形态,并精准切入饮食健康这一被忽视的巨大市场。Odyss 究竟如何实现对每一口食物的无感记录?面对“反人性”的质疑,宇扬又给出了怎样的回应? 与此同时,作为投资人的一豪也分享了 CreekStone 作为一支 AI native 基金的独特视角。在 AI 开启的新范式下,什么样的创始人才能脱颖而出,成为他们寻找的“中国 AI 黑手党”?我们聊了聊从产品定义、品牌塑造到市场策略,AI 硬件创业者如何在大厂尚未涉足的垂直领域找到自己的生存空间。 无论你是 AI 领域的创业者、从业者,还是对新物种充满好奇的探索者,希望这期关于敢于定义、勇于拓荒的对话,能给你带来新的启发。 📢 两条来自嘉宾的信息: 宇扬和团队正在招聘:移动端开发、全栈软件、硬件项目经理、交互视觉设计、海外市场营销、海外社群运营,对他们感兴趣的同学,请联系 hr@odyss.life Creekstone Venture 期待陪伴 AI 创业者,一起探究认知内核,把宏大梦想落地在前行的每一步!不当爹,求共鸣,期待创始人交流 yihaoli@creekstonevc.com 🎬 我们的视频播客来啦!本期播客在上海漕河泾 AI Hacker House 内录制。将随后上线于 @Koji杨远骋 的视频号、小红书、哔哩哔哩、Youtube 等平台。 📒 文字版将随后发布于 @十字路口Crossing 公众号。 🟢 00:01:11 快问快答:年龄、毕业院校、MBTI 和星座、融资情况、产品一句话介绍、发布时间、团队规模、创业前经历 🟢 00:03:03 为什么我不做 AI 眼镜? “现在做眼镜,就跟 2015 年的时候你去做 VR 一样。” * AI 眼镜的陷阱:它太想服务 AI(看我所看),却忘了服务人(佩戴舒适、不用频繁充电)。 * 为什么 Meta Ray-Ban 的成功在中国无法复制?——我们没有庞大的墨镜市场,也没有垄断级的 Ray-Ban 品牌。 * 硬件创业的残酷真相:电池和材料技术的进化是缓慢的,不像大模型每半年即使出一个大新闻。 * 为什么最终选择了“项链”?基于第一性原理推导出的唯一解:既要承重(续航),又要位于正面(看得见、听得清)。 * 为什么切入饮食健康?这是每个人最高频的行为,却是目前唯一缺乏硬件数据监控的盲区。 🟢 00:13:33 杜绝做任何“通用”的产品 普通人的生活很无聊,有什么值得被持续记录的? * 任何硬件购买都需要一个明确的动机,如果你做一个“通用的多模态入口”,用户买来就会吃灰。 * 所谓的“通用 AI 硬件”,本质上只是拼凑了多个垂类 Agent 的错觉。 * AI 录音卡产品?——“会议纪要长期来看是手机 OS 的系统级工作。” * AI 相机?——“普通人的生活很无聊,有什么值得被记录的?” 🟢 00:17:24 “吃”的天网:怎么让 AI 监督你咽下的每一口? 天网恢恢,“吃”而不漏。 * 真正的 Always-on:用户不可能吃饭时还要专门点一下设备,必须无感记录。 * 硬件设计取舍:砍掉相册功能,只保留低帧率、低分辨率但高对比度的图像——这才是 AI 爱看的图。 * 如何解决功耗和隐私?T0 时刻的端侧压缩 + 云端模型动态调配 T1 时刻的数据负载。 * 为什么现有的卡路里计算 APP 都不准?层级、冰块、甚至“到底有没有把汤喝完”,单张照片无法回答。 * 目前市面上实物识别最准的并不是垂直 APP,而是 ChatGPT。 🟢 00:29:27 面对最 Harsh 的质疑:关于“反人性”与 Context 猿猴从树上下来变成人,本身就是“反猴性”的。 * 一个新的观点:收集 Context 应该是好体验的副产物,而不是产品的卖点——“我妈不懂什么叫 Context”。 * 面对投资人“产品反人性”的质疑,怎么看?——猿猴从树上下来变成人,本身就是“反猴性”的。 * 反人性的产品未必没有价值,只是它的天花板可能只有 10 亿人,而不是 70 亿。 * 为什么要砍掉“实时提醒”功能?对于健康管理,数据呈现和行为规划比实时干预更重要。 🟢 00:49:42 品牌哲学:不做严肃医疗,也不学多邻国 “多邻国这个产品是学不好英语的,但我打卡了 700 多天。” * 为什么不想做严肃医疗?那经历了 20 年才走到大众市场,我们要的是一种生活方式。 * 为什么不学多邻国?它太游戏化了;我们更想成为 Oura —— 一种代表“成长与突破”的社交货币。 * 关于“美”的决策论:团队提供工程可行性,设计师提供审美,最后花钱投放广告让用户数据来决定 ID。 * 硬件的魔法时刻:软件是先看功能再看 UI,而硬件是先看外观再看功能。 🟢 01:05:56 李一豪:寻找“AI Native”的拓荒者 “巨大的野心,极小的 Ego,完整的世界观——这样的人一年看 500 个也遇不到 5 个。” * 到底什么是 AI Native 的基金?没有路径依赖,把自己视为弱者,做创业者的思想陪伴者。 * 顶尖创始人的画像:Common Sense(常识)基础上的非共识,敢于定义赛道而不是解题。 * 为什么偏爱字节系的创业者?字节是所有大厂里“最创业”的一个,也是唯一能让年轻人摸过万亿参数模型的地方。 * 投资就是“追求恋爱对象”:一旦认定,就以“天”为频率给创始人发信息,直到与其建立深度连接。 🟢 01:22:50 逃离大厂 “他口袋里装着一个探出头来的 AI 设备,书包里哗啦啦还有一堆,完全不 care 路人眼光。” * 大厂产品经理的困境:大部分时间在竞争内部资源、说服上级,而不是接触用户。 * 软硬结合创业的特殊性:硬件没有 A/B Test,也没有代码回滚,每一个决策都必须慎重。 * 创业后的心态变化:“以前周末会打游戏,创业半年没玩过一次,不是没时间,是玩不下去。” * 给创业者的最后建议:不解难题(别跟大厂拼技术参数)、敢定义赛道、聚焦垂类、紧贴用户。 欢迎订阅「十字路口」: 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我创办了十字路口,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间,在真格基金担任 Venture Partner(投资合伙人)。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我联合创办了十字路口,在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 的即刻
他看到了什么?| 对谈张帆:前智谱COO,元理智能创始人/CEO ——为何笃信 AI 的机会在 ToB?中国的创业者和 VC 对 toB 普遍感到“生理性恐惧”,但是本周「十字路口」的嘉宾张帆却选择逆流而上。 张帆曾是大模型公司智谱 AI 的 COO,最近他选择离开智谱,获得蓝驰创投的 800 万美金天使投资、创办「元理智能」,开始了 toB 企业服务作为创业方向,致力于通过商业强化学习,为企业提供能真正创造业务价值的数字员工。 张帆曾为第一次创业「妙计旅行」交过数千万美金的学费,也曾在智谱 AI 服务过上千家企业客户。在他看来,今天的 ToC 创业是与巨头进行的一场“不对称战争”,而 ToB 则因 AI 的出现迎来了全新的机遇。 在本期播客中,张帆和我们分享了他作为一个站在中国大模型浪潮最前沿的亲历者的故事。 你会听到他在投身 AI 之前,作为“妙计旅行”创始人的热血与遗憾:如何在5年间融资数千万美金,却最终因不理解产业的本质而“交了学费”;也会听到他在智谱 AI 做 COO 期间,如何带着团队疯狂地服务了上千家客户,看到了中国企业拥抱 AI 的渴望与迷茫,并最终坚定了他再次创业、投身 ToB 的决心。 希望这些内容对你能够有所启发,提供不一样的视角。 🎬 我们的视频播客来啦!将随后上线于 @Koji杨远骋 的视频号、小红书、哔哩哔哩、Youtube 等平台 📒 文字版将随后发布于 @十字路口Crossing 公众号 🟢 00:01:01 反共识:为什么说 ToC 是“一场不对称的战争”? “我总在想今天的反共识是什么?今天大家对于创业的共识,反而让我们觉得有点担心。” * 为什么说不能再用互联网时代的“旧地图”,去寻找 AI 时代的“新大陆”? * 一个体验再好的 AI 旅游 Agent,为何在携程这样的巨头面前不堪一击? * 体验的优势一年就能被追上,但供应链和运营体系的壁垒可能需要十年。 * 在“线上也满了”的今天,创业公司建立有效壁垒的真正难点在哪? 🟢 00:05:27 交了几千万美金“学费”后,我学到了什么? “当你把注意力从外部的 reward model (融资、媒体) 转回到业务上的 reward model (留存、满意度),你看到的东西会很不一样。” * 第一次创业「妙计旅行」:一个技术上完美、但商业上失败的 AI 旅游项目。 * “错误的 Reward Model”:VC 追捧、媒体热炒,为何这些“正反馈”是创业者最危险的错觉? * 核心教训:旅游的本质是供应链问题,不是产品问题。不能被交付的“高级信息”毫无价值。 * 趋势的力量:为什么在 2014 年轻松融到千万美金,而在 2022 年,能力强了 10 倍、准备更充分时,融资反而更难了? 🟢 00:21:02 在智谱的感悟 人类过去 5000 年脑容量没变,生产力却增长了 1000 倍。靠的是什么?教育、分工、工具和协作。这正是 AI 下一步的方向。 * 离开智谱 COO 职位的真正原因:这不是勇敢,而是看到了 AI 下半场的确定性机会。 * 一天 7 个客户会,两年服务上千家企业,看到了市场怎样的混乱与渴望? * 基座模型的智能已从 60 分进化到 110 分,抵达“临界点”。继续提升 IQ 的价值在递减。 * 新的使命:为 AI 构建“社会形态”,成为一家“模型的培训机构”,把聪明的通用模型变成专业的“工种”。 🟢 00:37:24 新旧世界的分野:AI 是同事,SaaS 是零和博弈 中国企业愿意为生产力结果 (人力外包) 买单,而不愿意为过程 (软件工具) 买单。AI 真正的对标的不是软件市场,而是劳动力市场。 * SaaS 在中国为何跑不通?当“转化能力”被视为固定成本时,SaaS 就成了与员工的零和博弈,而员工是必选项。 * AI 的颠覆性在于,它直接作用于“转化能力”本身,是与老板的“正和博弈”。 * 别再用旧坐标系看待 AI:模型的“幻觉”不是 Bug,是特性;就像人也有幻觉,关键在于如何驾驭。 * CEO 必修课:理解“模型性” (Model-Nature),就像理解人性一样,这是业务问题,不是技术问题。 🟢 01:09:15 生存法则:造轮船,而非灯塔 基座模型是不断上涨的大海,在上面建“灯塔” (应用),很快就会被淹没;你真正要做的是造一艘能随之上涨的“轮船” (业务壁垒)。 * 创业公司如何造出自己的“轮船”?答案是“50% 模型含量”法则。 * 为什么 Notion 能乘风破浪,而 Jasper 却快速陨落? * 最大的误区:“我有很多数据”。数据本身不是护城河,能够持续产生数据的“业务场景”才是。你要的是一块田,而不是一堆庄稼。 * 个体最佳实践 vs 行业最佳实践:为什么垂类 Agent 只是妥协,而为每个企业找到自己的最优解才是未来? 🟢 01:23:56 最后的 300 万美金,会投给谁? * 一个出人意料的选择:为什么他会把钱投给一家低调的公司——Thinking Machines Lab? 欢迎订阅「十字路口」: 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我创办了十字路口,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间,在真格基金担任 Venture Partner(投资合伙人)。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我联合创办了十字路口,在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 的即刻
AI来了,玩一场无限的创业游戏|对谈原今日头条初创期成员、票圈视频创始人丛广乐本周「十字路口」,我们邀请了一位经历丰富却非常低调的连续创业者丛广乐,他正在探索的三个极具野心的 AI 新产业方向。 他在 2011 年加入张一鸣创办的 99 房,亲历字节产品方法论的早期雏形。但在头条创办的前夕,他却选择转身扎入移动互联网的浪潮,希望能“走出一条属于自己的路”。他先后联合创办了红点直播和社区产品“最右” ,最近一次创业,是创办票圈视频,在微信生态中取得了“说出来我们所有人都会羡慕甚至嫉妒”的收入规模。 今天,面对 AI 浪潮,他认为移动互联网是 5、6 年就结束的“大航海”(有限游戏),而 AI 则是像电力一样的“生产力革命”(无限游戏) ,他也正在三个看起来像“无限游戏”的 AI 方向做尝试。 在这期节目中,你将听到广乐分享他在字节跳动学到的产品观,他对社区产品的思考,以及他对自己正在探索的三个 AI 方向的分享。 🟢 03:00 快问快答:年龄、创业经历、MBTI、一句话介绍公司业务 🟢 04:46 复盘 99 房:张一鸣的“APP工厂”与字节方法论 * 2011 年,张一鸣在 99 房就已经在用“穷举式”的 APP 工厂逻辑探索移动端。 * 字节的产品观雏形:个体体感、逻辑、想象力。 * 字节早期最核心的能力:充分理解和利用数据,把 PC 互联网的信息抓过来迁移到移动端。 * 回头看,字节的成功是必然的吗? 🟢 16:34 人生的十字路口:为什么没有跟着张一鸣做头条? “我记得当时是一鸣还找我聊过一次,然后说是要一起来做头条的方向。” * 当时的张一鸣:平静、有极大勇气、极其努力,是一个有纯粹创造价值追求的人。 * 为什么选择离开?一方面是学业冲突,另一方面是想去学一学“商业层面”的方法论。 🟢 21:32 从红点到最右:中国的 Discord 可能在微信里? “中国所有的移动互联网社区,几乎都要不是非常的垂,要不它要扩大都变成了内容平台。但海外不是的。” * 离开“最右”的核心分歧:是做一个高效率的“内容平台”,还是坚持探索“社区”本身? * 为什么国内社区产品逻辑不适用?第一,微信群已经满足了 70% 的社群需求。 * 第二,创业公司有商业指标,很难像微信一样“无为而治”,给社区足够的去中心化生长空间。 🟢 31:41 票圈视频的 B 面:从微信生态到 AI 信仰 * 2018 年创业的判断:“移动互联网没机会了”,人与信息、人与人、人与服务这三类普世需求都已被解决。 * 为什么在微信生态做视频?当时微信还没有视频号,视频发布像“文件”,我们想提供一个内容生产和存储工具。 * 2020年,当微信视频号出现时,我们就意识到这不再是我们的最大愿景。 * 为什么在 GPT-2 时代就开始看 AI?—— “视频供给侧终于可以变一变了”。 🟢 38:41 广乐的三个 AI 赌注:“我要做无限游戏” “这也是一种创业选择的方法论......我可能喜欢的问题,是跟微信会比较像,他只去思考对最底层的通信是什么。” * 赌注一 :构建一个替代创作者的 AIGC 系统,覆盖从灵感、选题、脚本到制作、乃至商业化的全链路。 * 赌注二:真正的“AI APP 工厂”,由 AI 自动化完成产品立项、PRD、代码实践和发布。 * 赌注三:AI 赋能的社区。移动时代是交互定义产品 (如 Uber),AI 时代是把生成能力赋予组织者,实现“非 3D 的元宇宙”。 🟢 50:38 终极对比:AI 浪潮 vs 移动互联网浪潮 * 移动互联网是“大航海”:发现新大陆,是“量变带来的质变”,它是一个 5-6 年就结束的“有限机会”。 * AI 是“生产力革命”:像工业革命和电气革命,是“质变引起的量变”,它的变革周期是无限的。 * 最大的不同:移动互联网是 60 分和 90 分的问题;AI 是 0 和 1 的问题。 🟢 55:35 AI 时代的组织管理与 B 级别机会 * 当优秀的人想做“一人公司”,你怎么吸引他们?—— 寻找那些对“发明”和“本质变革”感兴趣的人。 * 如何管理探索型 AI 团队?要提供“非确定的目标导向”,甚至以“学习和试错的速度”为衡量标准。 * 哪里还有 10 亿美金的机会?大模型基建、工具、行业级的“供给侧替代方案” ,以及新交互带来的新平台。 🟢 01:04:11 AI 创业的陷阱与壁垒 “如果你思考不清楚你的壁垒,那大概率是没意义的。” * 泼个冷水:哪些方向可能没意义?给大模型“打补丁”的;以及基于个体体感做的简单小工具。 * “速度”不是壁垒,它“太线性了”。 * 真正的壁垒是:数据、用户粘性、深度领域整合带来的复杂度,以及用户反馈的飞轮。 * 今天的 AI 时代,可能更像当年的“软件时代”,而不是“互联网时代”。 欢迎订阅「十字路口」播客 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我创办了十字路口,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间,在真格基金担任 Venture Partner(投资合伙人)。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我联合创办了十字路口,在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 的即刻 🎄 本播客由「新世相声音森林播客计划」支持。
「AI Infra 就是命运」 | 对谈王雁鹏:亲述从大数据时代到 3 万卡集群的中国算力演进史本周的十字路口,我们来聊聊 AI Infra,AI 的基础设施。 今年,OpenAI 这个基建狂魔疯狂刷屏,先是传闻中耗资千亿美元的星际之门(Stargate)超级计算机项目;最近又与 Oracle 签下价值高达 3000 亿美元的订单,要在全美建设 4.5 吉瓦的巨型数据中心。 这是什么概念?4.5 吉瓦,相当于近四个核电站的发电量;3000 亿美金,超过了许多国家的年度 GDP。 这些天价合同背后,传递出一个越来越清晰的信号——在 AI 的下半场,算法的创新固然重要,但算力好像正在成为终极的变量。 这场关于未来的军备竞赛,已经从代码和模型,延伸到了芯片、电力和数据中心这些更底层的物理世界。 正如 OpenAI 在去年底的一份报告标题:「Infrastructure is destiny」——AI Infra,就是命运。那么此时,中国的科技公司们在如何布局?在这场决定未来的竞赛中,我们又处于什么样的位置? 本周,我们请到的嘉宾是百度智能云 AI 计算首席科学家,王雁鹏。他的职业生涯完整经历了从大数据时代开始的中国互联网基础设施演进,他将“亲述”这段历程——从 CPU 时代的自研服务器,到 GPU 时代的大规模集群,再到今天,百度已建成国内首个全自研的三万卡集群。 此外,雁鹏还和我们聊了很多话题,比如: * 对硅谷 AI 巨头(OpenAI, Google, Meta)的看法 * 国产 AI 芯片破局的唯一路径是什么? * 作为架构师,如何不沦为“运维”,并找到自己的职业价值? 希望这期内容能对你有所启发。 🟢 02:41 快问快答 年龄、毕业院校、MBTI 和星座、一句话介绍百舸。 🟢 03:38 一部互联网基础设施演进史 从打车去机房搬服务器,到一键调度万卡集群,一个亲历者眼中的三大计算时代。 * 第一阶段:大数据时代。Google 用三篇论文定义了游戏规则,用廉价 PC 搭建高性能系统,让互联网大厂开始自建数据中心。 * 第二阶段:云计算时代。亚马逊以“弹性”为核心,通过虚拟化技术,让创业者告别了自己搬服务器的“史前时代”。 * 第三阶段:AI 时代。计算范式从 CPU 跃迁到 GPU,算力被堆到极致,但代价是必须“软硬一体”,软件不再能免费享受硬件红利。 * 为什么说大模型是真正的“工业革命”?它带来了 Scaling Law——一个可复制、可预测的“工业范式”,堆算力就能换智能。 * 当年的英特尔 vs 今天的英伟达:一个信奉“软硬解耦”,一个坚持“软硬一体”,为何后者成为了 AI 时代的唯一霸主? 🟢 25:06 OpenAI 千亿美金的投入是远见还是浪费? “如果 AI 投资白花几千亿是很不幸,但不投的风险更大。” * 算力、算法、数据,哪个更重要?——算力。互联网数据已基本耗尽,未来无论是合成数据还是强化学习,都需要算力“制造”新数据。 * DeepSeek 的“巧劲”能否对抗 OpenAI 的“大力”?两者不矛盾,算法效率仍需算力实践。 * 中美算力差距:3 万卡 vs 10 万卡,物理鸿沟将如何影响创新? * 万卡集群挑战:电力是巨大瓶颈,一个 3 万卡集群需园区级变电站。 * “现在建数据中心是浪费吗?”——不建才是问题。不建就是拒绝创新,现在的投入是“用钱缩短到达未来的时间”。 🟢 40:10 百度百舸:为何敢称“迄今最强”? * 百舸是什么?一个为 AI 打造的高效算力平台,核心理念是支持超大规模、异地异构异网使用,追求极致工程效能。 * “最强”的底气:源自百度十几年 AI 应用积累与芯片—平台—模型—应用的全栈一体化布局。 * 百舸的差异化:四层架构联合优化,实现内外打平、极致高效。 🟢 45:20 中国会诞生英伟达吗?AI Infra 还有创业机会吗? * AI Infra 创业的现实:有机会,但难诞生巨头。 * 中国版英伟达的唯一路径:它必须与“最先进的模型”深度绑定一起出现。 * 当国产芯片能支撑最领先模型时,它就成功了。 🟢 49:16 美国 AI 巨头们:各有路径 * Google 卷土重来:拥有最不缺的算力(TPU)与最深的技术栈。 * Meta 的天价挖人:资本逻辑合理(1 亿挖人 vs 1000 亿买卡),但组织上不健康。 * OpenAI:用未来愿景加杠杆,以高风险推动基建革命。 🟢 58:42 AI 时代,给新一代工程师的建议 “不懂算法的 Infra 不是好 Infra。” * 如何摆脱“救火队员”的宿命,做出能拿“100 万美金最高奖”的创新? * 为什么未来不懂 Infra 的算法工程师会被淘汰? * 顶尖 AI 人才的全栈能力:从应用到架构都要懂。 * 对新一代工程师的建议:这是个美妙的时代,打通技术栈,决定你能走多远。 欢迎订阅「十字路口」播客 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我创办了十字路口,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间,在真格基金担任 Venture Partner(投资合伙人)。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我联合创办了十字路口,在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 的即刻 🎄 本播客由「新世相声音森林播客计划」支持。
刚完成亿元级融资,他要如何挑战 AI 硬件的“不可能三角”|对谈马啸:未来智能创始人/CEO在今年火热的 AI 硬件赛道里,AI 耳机几乎已经是一张“明牌”。它方便携带,能通过录下用户听到的声音作为 AI 的“耳朵”来补充物理世界的信息,弥补 AI 所需要的上下文。 那么,如何做一款 AI 耳机呢? 本周,我们邀请刚刚宣布获得来自蚂蚁、启明等投资机构亿元级规模融资的未来智能创始人兼 CEO 马啸,这已是他们今年的第三次融资。 未来智能推出的讯飞 AI 耳机在各大电商平台稳坐 AI 耳机销量榜首,创业到现在已经实现了持续盈利。 马啸分享了他做 AI 耳机的 15 年旅程,对 AI 硬件如何成为“入口”的理解,以及在硬件本身的“不可能三角”(即性能、续航与重量)中,如何做出艰难的取舍,并最终超越它。 除此之外,马啸也和我们分享了他在职场这些年的一些心路历程,当坚持把耳机做下去的决定不被理解,当所有人都告诉他此路不通,他如何顶着巨大的压力,在内心深处反复诘问自己:“万一是别人错了呢?” ——正是这份反思,让他学会在低谷中理解自己,并最终在“贵人”的点拨下,做出“follow my heart”的决定,开启了创业之路。希望这些分享能让大家有所收获。 🎥 本期播客在 AI Hacker House 录制,视频播客将会发布于 Koji杨远骋 的小红书、B站、视频号、Youtube。 🟢 02:21 快问快答:年龄、毕业院校、MBTI 与星座、一句话介绍产品、收入与利润、团队规模、创业前在做什么 🟢 04:54 穿越周期:AI 硬件的血泪与选择 * 我们给自己的定位:做全球最好的“AI 软硬件一体化”的办公助理公司。 * 穿越周期的感悟:亲身经历过上一代 AI 浪潮(第三波)“喧嚣过后又归于沉寂”的全过程。 * 所有的硬件都可以被 AI 再改造一轮,但你不能什么事儿都自己做,必须要有重点。 🟢 06:51 AI 入口不是“下一个手机” * 未来的 AI 入口可能不只是一个,不要总想着“用另一个硬件去打败手机”。 * 为什么是耳机?它是用自然语言跟 AI 交互的好方式,可以随时随地携带。 * 耳机的优势是随身,劣势是没屏幕、交互效率可能不高,但它是一个不可避免的交互途径。 🟢 10:09 AI 耳机的“5+X”能力与“不可能三角” * 创业初期的坑:AI 功能很强,但耳机本身很烂。一个好的 AI 硬件,首先要具备它原来该有的功能。 * 什么是“5”?耳机的五个基本盘:音质、外观、续航、降噪、佩戴舒适度。 * 什么是“X”?AI 耳机要超越传统耳机,它要能“陪用户一起听”,把外界的自然信息实时转换成数据流。 * 硬件的“不可能三角”:续航、重量(舒适度)和处理性能。必须取舍。 🟢 14:27 “性感”与“皮实”:AI 耳机的艰难取舍 * 牺牲一定的“性感”和“优美”,换取“商务化”和“皮实”。 * 商务用户一天可能有 6-8 小时的会议,需要 AI 录音全程在线,不能中途换耳朵充电。 * 把通话续航做到了 9-10 小时,市面通常是 5-6 小时。 * 最大的取舍之一:音质。好的喇叭是能耗大户,必须在续航和音质间找一个平衡点。 🟢 17:47 红海中的“非共识”:为什么平台巨头做不了未来智能在做的事情? * “AI 耳机”是共识,但“做什么样的 AI 耳机”这个问题下有大量非共识。 * 手机厂商(苹果、华为)必须做量大面广的耳机,在“5”个属性上卷到极致。 * “我们从第一天就很清楚:创业公司很难跟苹果竞争。”在垂直领域(会议办公)找突破。 * 服务几千万人的垂直办公助理,对平台(苹果)来说是“杀鸡用牛刀”,他们短期不会做。 🟢 23:03 未来智能的看家本领:在蓝牙窄带上传输音频流 * 行业难题:蓝牙通话会占满经典蓝牙带宽,无法再传数据。 * 未来智能的“黑科技”:改造 BLE GATT 协议(原用于传小指令),稳定传输语音流。 * 技术护城河只是短期优势。 * 真正的护城河是用户的心智和认可。 🟢 30:22 “用户一边骂一边用”:靠 80% 月活数据说服果链代工厂 * 2021 年(ChatGPT 前),“AI 耳机”概念不被接受。 * 打动苹果的耳机供应商 * 关键数据:讯飞上一款失败的产品(只卖 4 万台),App 月活竟高达 80%。 * “用户一边骂一边用”:骂耳机难看、音质烂,但就是离不开录音转文字功能。 * 创业的底气:只要把耳机本身做好,这个 AI 功能就能引爆。 🟢 41:14 务实的 8 小时:为什么不做 24 小时“Always-on” * 24 小时全天候录音?这个想法很激进,但现在一定是非主流。 * 人对隐私的关注非常高,技术、伦理、社会接受度都要跨越。 * 先把“工作 8 小时”里最有价值的点做好。 🟢 51:56 为什么不做《Her》?我踩过“万能助理”的坑 * 在讯飞做过中文第一个类 Siri 产品,但有两个瓶颈至今难解。 * 瓶颈一(已解决):AI 的理解能力。 * 瓶颈二(未解决):“服务贯通能力”。你想语音订机票?在线服务平台根本不愿开放他们的内部交易流程。 * “万能助理”最大的失败:告诉用户什么都能干,但每一样都干得非常平庸。 🟢 56:29 “硬件是短板原理,互联网是长板原理” “为什么很多互联网公司做硬件都不太成功?就是他用互联网思维做硬件。” * 互联网(长板):一个功能特别好就行,别的 bug 快速迭代。 * 硬件(短板):一旦发布,一个致命缺陷就能让公司完蛋。研发、开模、库存“像山一样压过来”。 * 硬件的渠道信心极其重要。 * 我为什么还选硬件?“硬件更像种地,春种秋收,能逐渐积累优势,让人感觉踏实。” 🟢 01:06:21 “万一是别人错了呢?” ——决定创业的 30 分钟电话 “我就怀疑自己,难道我想错了吗?... 万一是别人错了呢?” * 在讯飞后期的困境:公司高层已拍板砍掉耳机业务。 * 内心煎熬:抓着 80% 的月活数据,觉得“再做一代就能成”。 * 科大讯飞联合创始人胡郁对马啸说:一定要 Follow your heart,才能把自己的能量发挥出来。 * 以前听了这么多 follow your heart,但当自己真的在那个情境里了才真正明白这句话。 🟢 01:18:40 AI 人才的“巨大断层”:老专家可能不如新学生 * 做一家“本分”的公司,做“人机协同、解放人的能力”的 AI,而不是替代人的 AI。 * AI 人才出现了巨大的“撕裂和断层”。 * 上一代 AI,算法、产品、Coding 是分离的。 * 新一代 AI,他们天然就把场景、Coding 和算法融为一体。 欢迎订阅「十字路口」播客 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我联合创办了街旁/新世相/躺岛,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。欢迎大家找我聊天,碰撞想法,链接下一个可能性。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 即刻 🎄 本播客由「新世相声音森林播客计划」支持。
当阿里入局全球 AI Coding,战场里的 60 天 | 对话叔同:Qoder 创始人“很正确,无比正确。” 当我们问起阿里巴巴 Qoder (Agentic Coding 产品)创始人叔同,关于他带领团队冲入全球 AI Coding 这片“红海” 60 天后的感受时,他给出了这样简单而坚定的回答。 他的底气,源自一份优秀的成绩单:上线 5 天用户迅速突破 10 万,仅 60 天斩获 50 万开发者用户。 AI Coding 可能是今年 AI 领域最热的话题。 Cursor 年营收达到 5 亿美元、估值飙升至 100 亿,成为硅谷最炙手可热的独角兽;Anthropic 也凭借其强大的 Claude Code,让收入增长曲线比 OpenAI 更陡峭。 在这片卷得炽热的战场,后来者阿里的机会在哪里? 本周,我们邀请到了曾多年担任阿里巴巴“双十一”技术负责人、最早在国内推进全行业云原生化的技术领头人,听他独家分享 Qoder 上线 60 天即取得“开门红”的背后,是怎样的产品思考、技术布局和组织能力在支撑。 🎉 本期节目特意选在 1024 上线,祝所有用代码改变世界的朋友们节日快乐,发量浓密,代码无 Bug! 🎥 本期播客在 AI Hacker House 录制,视频播客将会发布于 Koji杨远骋 的小红书、B站、视频号、Youtube。 🟢 03:11 快问快答:年龄、毕业院校、MBTI 与星座、一句话介绍产品、收入与利润、团队规模、Qoder 前的探索经历 🟢 03:27 AI Coding 全景图:从 0 到 1 vs 从 1 到 100 一个典型的用户路径:先用 AI 生成一个网站雏形,当它开始产生商业价值,再用更专业的工具去维护和迭代。这背后反映了什么? * AI 写码赛道的三种主流形态:服务于创作者的“想法落地”型工具、服务于专业开发者的“效率提升”型工具,以及直接替代人力的“数字员工”。 * 为什么说所有形态的 AI 写码工具,最终都不可避免地会走向“大一统”? * “没有自研模型的 AI Coding 工具,只是在帮模型厂商打工”,为什么说 Cursor 这样的公司最终一定会构建自己的模型能力? * 大厂做 AI Coding 产品有何天然优势?除了成本,更重要的是能和模型进行端到端的联动优化。 🟢 09:48 红海突围:Qoder 的战略选择 当所有人都去摘那些“低垂的果实”时,我们选择了直接进攻“价值高地”。 * 一个关键的战略选择:我们绕过从 0 到 1 生成新项目的“酷炫”场景,直接切入占开发者 95% 工作时间的“真实软件”研发领域。 * 为什么我们把 Qoder 定义为“智能体编程平台”?因为未来的开发协作模式,将从“人机协同”进化为“AI 自主编程”。 * “我不干,智能体干”,这是一种全新的开发范式。 * 另辟蹊径的原因:作为一个后来者,我们希望通过差异化定位,快速在红海中找到自己的生态位。 🟢 16:55 需求文档是最重要的! AI 不但擅长写代码,更擅长写需求文档。 * 从“提示词工程”到“上下文工程”,我们如何让 AI Agent 能够独立完成更大、更复杂的任务?答案是 Spec-Driven(需求文档驱动)。 * 一个典型的 Spec-Driven 工作流:用户提出一句话需求 -> “文档 Agent” 自动生成详细设计文档 -> 用户确认后驱动“代码 Agent”长时间执行。 * 这其实是对现实世界中“老板提需求 -> 产品经理写 PRD -> 工程师开发”这一流程的 AI 化映射。 🟢 21:44 产品哲学:从“不打断心流”到“给你掌控感” AI 时代,开发者被迫进行“结对编程”,过去那种完全不被打扰的“心流”已难以维持。 * AI 时代的新矛盾:既要提供趁手的工具,又不可避免地会打断用户的心流,如何平衡? * 我们的答案:与其徒劳地追求不被打断,不如给用户完全的“掌控感”,让他成为 AI Agent 的管理者。 * 一个反常识的产品设计:为什么 Qoder 至今不让用户选择模型? 因为“机选优于人选”,也避免了用户成为“模型测试员”而产生的决策疲劳。 * 我们如何平衡性能、效率、成本这个“不可能三角”?核心在“上下文工程”的精细化运营。 🟢 32:26 组织与方法:如何支撑一场闪电战? 为什么 Qoder 能够快速起步?因为我们不是从零开始,而是整合了阿里内部多个成熟团队的人才和技术积累。 * 从服务中国市场的“通义灵码”,到面向全球的“Qoder”,背后发生了怎样的组织和战略演进? * 一个关键决策:为了争取全球市场的时间窗口,我们先用全球最好的模型服务开发者,同时“以战养战”,为自研模型的发展赢得时间。 * “它就是独立经营的一块业务”,大厂内部创业如何通过组织设计,真正地“甩掉包袱”,实现创业公司级别的敏捷? 🟢 40:13 Repo Wiki:攻克“祖传代码”的秘密武器 我们学计算机第一课,老师就说要写好文档和注释,但几乎没有团队能真正做到。这是一个如此显性的需求,为什么之前没人做? * 开发 Repo Wiki 的第一性原理:“文档是会骗人的,但代码永远是最新的。” * 我们如何用 AI 解构“祖传代码”?通过分析代码的当前切片和所有历史提交记录,还原出整个系统的设计思想和业务逻辑。 * 如何保证这个文档不过时?随着代码库的变更,AI 会实时、增量地更新这份“活文档”。 * 为什么我们有信心构建壁垒?因为这不是一个原子能力,而是一整套深度定制的模型、Agent 和与 Git 结合的团队协作工作流。 🟢 01:03:19 | 1024 寄语:AI 时代,程序员如何进化? 程序员可能是最不惧怕学习的群体,这恰恰是我们在 AI 时代最大的优势。 * AI 会取代程序员吗?不会,同时“杰文斯悖论”告诉我们,当成本降低,需求会爆炸式增长,程序员的数量可能会变得更多。 * 未来工程师的核心竞争力是什么?从单一的编码能力,转变为“需求洞察、整体设计、结果验收”等复合能力。 * 给计算机大一新生的建议:拥抱 AI,但更要学好计算机体系结构,因为你得知道 AI 有没有在“忽悠”你。 🟢 01:09:48 | 双十一往事:一个顶级架构师的两次“高考” 老板给了一个疯狂的目标:双十一流量翻 50 倍,集团能不能不多花一分钱?我们最终做到了。 * “在双十一之前,先创造无数个双十一”,如何通过“全链路压测”这剂猛药,在真实流量下反复演练,驯服上千个系统? * 技术人如何永远“跟技术要红利”?从解决稳定性问题,到通过容器化、云原生技术极致地优化成本,这背后是一套完整的方法论。 * 顶级架构师的成长之路:从解决一个技术难题,到构建一套技术体系,再到将技术能力产品化、商业化,最终寻找更大的舞台。 欢迎订阅「十字路口」播客 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我联合创办了街旁/新世相/躺岛,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。欢迎大家找我聊天,碰撞想法,链接下一个可能性。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 即刻 🎄 本播客由「新世相声音森林播客计划」支持。
2025 AI 现场:我们这一年的目击与狂想本周的十字路口,我们和庄明浩(「屠龙之术」主播)一起,复盘 2025 年的 AI 和科技行业的大事件,以及身处其中的我们的一些记忆与感受。 这一年,我们既是目击者,见证着技术的快速迭代、产品以前所未有的方式颠覆日常;同时,我们也被卷入了一场关于未来的集体狂想,在创新的巨浪和无尽的可能性面前,时而兴奋,时而迷茫。 我们从明浩提出的年度关键词“拐点”聊起,复盘了从年初的 DeepSeek R1 到最近的 Sora 2 的各种模型大战、Manus 引爆的“Agent 元年”;探讨了开源生态和人才流向;并最终将目光投向资本市场——当我们该如何理解这场关乎未来的集体狂想? 欢迎收听本期内容,和我们一起将在 2025 年亲历的观察与感受,沉淀为这段 AI 时代的共同记忆。 ———— 本期节目由鸿蒙特别呈现:「“码”上出发,洞见生态的力量」 —— 🎥 本期播客在 AI Hacker House 录制,视频播客将会发布于 Koji杨远骋 的小红书、B站、视频号、Youtube。 🟢 02:09 2025:向上还是向下的“拐点之年” “我们不知不觉地走到了很多事情的极限里面,技术也好,产品也好,钱也好。” * 尝试用一个词概括 2025,为什么说“拐点”一词最妙? * 向上的拐点:数据中心的建设狂潮预示着 2026 年的爆发。 * 向下的拐点:泡沫何时破裂?我们是否已在不知不觉中触碰到技术和增长的极限? 🟢 03:24 大模型战场:中美技术路线的分野与共识 * DeepSeek r1 如何用百万美金成本,撬动了百亿美金的基建叙事? * Sam Altman 重新定义“图灵时刻”:为什么 AGI 可能不会“翻天覆地”,而是“轻轻迈过”? * 头部模型厂商的生存法则:Anthropic 做深 B 端,xAI 走野路子,微软为何被迫自研模型? * 在纯 Chatbot 战场,战役已经打完了吗?ChatGPT 8 亿周活的背后,是护城河还是增长极限? * 中国厂商的共识与武器:为什么“开源”成了对抗美国 AI 趋势的唯一手段? * DeepSeek V3.2 的发布意味着什么?为什么我们今年可能等不到 V4 和 R2 了? 🟢 23:42 AGI 的另一条路:从 Sora 2 到世界模型 “如果视觉模型也是主桌,那它可能用另外一种方式会实现 AGI。” * 多模态战场为何比语言模型竞争更激烈?美图、营销视频 Agent... 场景和商业化路径无比清晰。 * OpenAl 的产品心法:为什么是 Sora 2 走入了千家万户,而不是技术同样领先的其他产品? * 这个世界真的不需要一个“AI 抖音”吗?或许 OpenAl 的目的根本不是做抖音。 * Google 回来了!世界模型 Genie 会是通向 AGI 的另一条路,甚至是“世界的子宫”吗? 🟢 39:04 Agent 元年,然后呢? * 为什么 Agent 将在 L3 阶段停留很久?因为它第一次将 AI 能力从“语言”延伸到了“行为”。 * Manus 的历史意义:它让用户第一次知道了 Agent 该长什么样,心智定义价值千金。 * Agent 创业公司如何活下去?当通用 Agent 成为巨头显学,垂直领域的法律、金融、营销反而异常繁荣 * 注意力经济的挤压效应:当主流赛道挤满人,为什么连“AI 动态漫”这种天花板有限的赛道都能拿到钱? 🟢 49:11 手机厂商的端侧 Agent * 为什么说真正的“手机助理”,Siri 做不到,但今天的端侧 Agent 可以? * 鸿蒙 HMAF 框架的启示:当 OS 不再自己做一切,而是将意图下发给 APP 的原生 Agent,会为开发者带来什么新机会? 🟢 53:00 开源、鸿蒙:中国特色的生态 * 从“头部模型一定是闭源”到“2026 年开源模型会登顶”,Sam Altman 的观点为何发生转变? * 开源如何商业化?DeepSeek 的 API 照样卖钱,且成本比 OpenAI 低几十倍。 * 开源如何成为一种“武器”?在争夺欧洲、东南亚、中东等中间地带时,开源天然地拥有信任优势。 * 本地部署的需求有多旺盛?一款内存和显存超大的笔记本电脑,因为适合本地部署大模型而被迅速抢购一空。 * 开发者有哪些新的“生态位”可以抢占?鸿蒙开发者凭借数款小应用月入 7 万。 🟢 01:08:36 二级市场狂热,一级市场呢? “当年大家认为 AI 是一个技术、一个产业,今天 AI 就是市场本身。” * Sam Altman 的“终局思维”:当一家公司试图将未来五年的增长预期全部打包,会发生什么? * 另一面,中国创投圈“我们太过熟悉的移动互联网增长叙事,在今天不能复制。” * 投资人如何寻找信心?当 AI 纯软件的故事讲不通时,大家开始集体投向大疆、石头、追觅背景的硬件创始人。 * 与互联网泡沫的终极拷问:光纤可以为未来铺路,但三年就会过时的显卡呢? * 有趣的信号:除了英伟达,今年标普 500 涨得最好的竟是希捷和西部数据这两家硬盘公司。 * 泡沫警报:当 AI 巨头开始依赖债务融资,令人想起“次贷危机”的幽灵是否正在靠近? 欢迎订阅「十字路口」播客 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我联合创办了街旁/新世相/躺岛,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。欢迎大家找我聊天,碰撞想法,链接下一个可能性。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 即刻 🎄 本播客由「新世相声音森林播客计划」支持。
拜托了,AI!帮忙解决「看病难、看病贵」吧|对谈王国鑫:京东健康探索研究院首席科学家最近,美国多家 AI+医疗明星公司接连传来进展:OpenEvidence(医学知识搜索) 的 ARR 已突破 1000 万美元,每天有上万名医生付费使用;Abridge(临床文档转写) 完成 2.5 亿美元融资;Tempus AI(肿瘤学与精准医疗) 已在纳斯达克上市,市值一度超过 60 亿美元;Hippocratic AI(医疗专属大模型) 估值也已达数十亿美元。 这些公司共同展示出一个趋势:AI 正在全球范围内迅速重塑医疗行业。在国内,AI+医疗同样在如火如荼地发生。硅谷知名风险投资机构 a16z 预言:医疗保健将成为从 AI 中受益最多的行业。 因此本周,我们邀请到京东健康探索研究院首席科学家王国鑫 Nico,请他分享「京医千询2.0」大模型与「AI 医院」的研发与应用。他不仅谈到在企业战略层面,AI 产品如何通过京东健康的医检诊药生态,来满足用户健康需求,也解析了以 OpenEvidence 为代表的美国初创公司目前在 AI+医疗方向的主要探索与不同侧重。 医疗是监管最严、数据最敏感、决策最攸关生死的垂直领域。因此,Nico 今天分享的经验和方法——如何找到真实痛点、如何积累专业数据、如何在产品和战略层面争夺用户心智——**对所有垂直大模型行业都具有启发意义,**相信也能给正在思考 AI 落地的你带来一些参考与帮助。 最后,Nico 还带来了他作为科学家的个人健康管理小技巧,简单实用,谁都能用得上。 🟢 01:49 「十字路口的」的快问快答:年龄、在京东健康的年限、MBTI 与星座、一句话介绍产品“京医千询”、公司收入与利润,以及大模型业务的核心战略定位。 🟢 02:42 AI 的终极拷问:如何解决医疗行业最根本的痛点? “我相信每个人是都想活一辈子… AI 在这个里面扮演的最大的特点就是能不能提升供给水平。” * 京东健康每天有 49 万次医疗服务咨询,AI 最初的角色是保证业务“合规”与“降本”。 * 为什么大模型让所有人眼前一亮?因为它表现出高度的“类人水平”,开始让人思考创造“医生水平”的 AI 的可能性。 * AI 能否低成本扩大供给,让我们每个人都有一种均等的高水平服务?这是所有做医疗 AI 的人,最终极的价值创造。 * 大模型不仅能在身体健康上实现平权,也能在精神健康上实现“情绪平权”,接住每一个人的情绪。 🟢 07:57 医疗数据的「痛并快乐着」 医疗数据可能是数字化水平最高的行业之一,但为什么它仍然是垂直模型最难啃的骨头? * 医疗 AI 从业者的“幸运”:国内医院花了巨大的力气,跑过了信息化时代,数字化水平相对较高。 * 核心痛点:医生的思考和推理过程是缺失的,模型只能看到提炼后的结果,无法学习“如何思考”。 * 数据天然在物理上是分散的,确权也存在问题——数据到底属于医院、医生,还是患者? * 为什么以前跨医院检查不互认?即便同是 CT,也可能因为设备、技师的原因导致结果无法形成共识,这背后是专业壁垒。 🟢 12:10 一个内部申请预算的公式:什么样的行业值得做垂类大模型? * 判断是否需要垂类模型,可以从“数据是否低成本可获取”和“商业模式是否显而易见”两个维度来划分。 * 如果一个行业的知识门槛不高,经验能被新技术轻易替代(如语言教育),那么做垂类模型的机会就比较小。 * 为什么代码是垂类模型的“天选之子”?因为它的商业模式清晰到让所有通用模型公司都无法拒绝。 * 垂类模型机会的两大特征:数据拥有独占性和独特性;商业模式足够清晰且价值足够高。 🟢 25:29 京医千询 2.0:不止于文本,三大核心进化 * 进化 1:从真实数据到大量使用“合成数据”,并向行业开放了可模拟真实医患对话的 Agent。 * 进化 2:从单模态到多模态,一个模型内同时支持 CT、MRI、X 光等影像数据的理解。 * 进化 3:从简单推理到“循证推理”,模型做出的每个判断,都能追溯到具体的证据来源(如顶刊论文、国家指南)。 * 如何验证海量合成数据的准确性?通过“三层漏斗”:内部全职医生团队、合作医学院、百人外部专家质控委员会。 🟢 34:07 灵魂拷问:垂直模型在哪些具体问题上能秒杀 GPT? “医学最重要的是诊断准确和处置方案有效,专业压过服务体验。” * 专业模型的核心是“拟专家能力”:通过简短的核心问题快速做出判断,而不是像通用模型一样为了全面而问遍所有可能。 * 如果让通用大模型去看一张医疗影像,效率会大打折扣,而垂直模型专门为影像的专业词汇、脏器位置、微小病灶做了优化。 * 跑分和真实产品体验没有百分之百的关联,我们内部更相信专家的评估指标。 * 为用户建立专属的、可长期追踪的“家庭健康档案”,这是通用模型很难做到的产品差异化。 * 做心理医生的难度,远高于做内科医生。如何衡量和优化模型的“共情能力”是目前的技术难点。 🟢 55:17 AI 医院:一场争夺「未来健康第一入口」的阳谋 * 为什么要做“AI 医院”?当你有内科、药师、营养师等多个 Agent 后,需要一个统一的产品心智,去争夺用户的“健康第一入口”。 * 京东做医疗的底气是什么?我们是一家有实体医疗机构、有药品供应链、能实现 30 分钟送药上门的公司。 * 未来的竞争,将是 Chatbot 的能力,再叠加后端服务能力的通盘竞争。 * 对于通用大模型公司,我们更多地将其当做“合作伙伴”,而非“竞争对手”。 🟢 01:11:57 给普通人的建议:如何利用 AI 更好地生活? * 一个很反人性的洞察:健康的“需求”是无限的,但只有在“失去”健康时,这个需求才变得真实。 * 一个普通人能立刻执行的健康建议:每年强制拿出一笔钱投入到健康上,用经济手段“逼”自己调整认知,这在中期看是省钱的。 * 要相信一句话:很多疾病在早期发现,以今天的科技水平都是有解法的;一旦错过,就只剩下缓解的方法。 🟢 01:15:34 投资人视角:如何判断一个垂直大模型公司? * 这个行业的知识深度和数据壁垒真的存在吗?这是一个 0 和 1 的问题。 * 它的商业机会不能那么大,否则大公司一旦注意到,你就没戏了。 * 这家公司的商业落地预期是什么?是 API 付费、产品付费,还是销售驱动?创始团队的背景和能力是否匹配? 欢迎订阅「十字路口」播客 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我联合创办了街旁/新世相/躺岛,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。欢迎大家找我聊天,碰撞想法,链接下一个可能性。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 即刻 🎄 本播客由「新世相声音森林播客计划」支持。
在双减“废墟”上,用 AI 重启人生 | 对谈连续创业者刘夜:从作业盒子到 Talkit本周「十字路口」的嘉宾在职业生涯像是坐了一趟过山车——他就是前作业盒子创始人,现任 VisionFlow 创始人刘夜。 刘夜曾将作业盒子打造为覆盖上亿师生、服务十万所学校的教育独角兽,但双减突然发生,业务遭遇重创。而刘夜在经历了这场巨变后,决定在双减”废墟”上重新起航,开启新的 AI + 教育创业。 VisionFlow 获得约 1000 万美元的种子轮融资,出资方包括知名企业家李想、阿里巴巴合伙人曾鸣及语嫣等,是 AI 语言学习赛道种子轮融资最多的公司。 刘夜认为 AI 彻底解锁了语言学习中一直无法突破的口语难题,过去几十年的「不可能之事」,现在成了可能。基于此,VisionFlow 推出首款产品 Talkit,一个完全为口语练习打造的 AI x 3D 虚拟世界。 本期内容中,我们会聊产品、聊 AI,我们也会听刘夜分享他从作业盒子到 Talkit 的这段特殊旅程——这其中有关于创业的思考,有面对突然崩塌时的心态调整,以及如何重整旗鼓、再次起航的经验。 我们每个人在一生中都可能面临「人生重启」的关键时刻,希望刘夜的经历,可以给大家带来启发和勇气。 🟢 03:11 快问快答:年龄、毕业院校、MBTI 与星座、一句话介绍公司产品、融资情况、收入与利润、团队规模、本次创业前的探索经历 🟢 05:14 AI + 教育 * AI 来了,为什么我们学英语的方式还停留在上个世纪? * “多邻国是一家专注于‘手’的公司,而我们是一家专注于‘嘴’的公司。” * 一个诞生于 1980 年的语言学习理论(TBLT),为什么直到 AI 大模型出现才真正迎来春天? 🟢 09:12 Talkit:为语言学习打造一个友好的虚拟世界 * 你以为移民到美国那样的真实环境就能学好英语?不,那个世界对学习者并不友好。 * 为了创造一个完美的学习环境,他们自研了一整套“世界生成引擎 (Gen World Engine)”。 * 当 Roblox 还在靠用户创造世界,他们已经能让一个实习生一个月生成 1000 个 3D 虚拟人。 * AI 如何做到既能陪你聊天,又能像个顶级私教一样,精准控制教学内容的难度? 🟢 14:40 伟大的对手:多邻国 一个让很多人抱怨“学不会”的产品,为何能成为市值百亿美金的巨头?它真正的护城河到底是什么? * “解决刚需的生意不算伟大,‘刚需’是农业社会陈旧和腐朽的词汇。” * 多邻国的核心产品哲学:“轻松第一,有效第二”。你永远教不会一个不出勤的学生。 * 绝大多数人使用多邻国,就像去健身房打卡,学习只是一个令人愉悦的“副产品”。 * 多邻国流失的那 8.5 亿用户,都去了哪里?他们都在寻找真正能开口说的方法。 🟢 29:07 双减时刻:从行业清零到内心解脱 一场几乎清零了整个行业的灾难,为何对身处风暴中心的人来说,反而是一种“解脱”? * 双减靴子落地,他和联创通电话,两个人的感受居然都是:“挺好的”。 * 如何判断你的事业是否违背初心?问自己一个问题:“如果我有小孩,会让他用我的产品吗?” * 他曾手握近 10 万个比特币,却为了一份自己认可的教育事业,放弃了成为交易所巨头的机会。 * 如何消化一次创业失败带来的巨大遗憾?答案只有一个:做成一个更伟大的公司。 🟢 36:41 迷茫的三年:一个顶级创业者的“空窗期”生存法则 * 创业中断后,他没有报复性创业,反而陷入了“极度渴望被需要”的状态。 * 一个他调研半年、投资人追着投钱的连锁咖啡项目,为什么在最后关头被他亲手叫停? * “价值不是由功能决定的,而是由独特性决定的。你到底是一个套利的商人还是一个企业家?” * 为什么说创业是反人性的?因为你要去做一些“如果你不做,就没人做”的、足够难的事。 🟢 52:09 用 12 个「我是...」来造句 * 我是高山滑雪全国亚军 * 我是国家二级游泳运动员 * 我是积水潭医院骨伤科常年会员 * 我是全球医生社区会员 * ……剩下的 8 个更精彩,请收听播客 🟢 59:52 一直游到海水变蓝:给新一代 AI 创业者的三个建议 * 创业心法“苦海不苦”:当你能清晰看见远方的蓝海,当下的苦海也就不再痛苦。 * 给 AI 创业者的建议:警惕“假机会”焦虑,真正的机会其实很少,要敢于花时间寻找。 * 拥抱孤独,不要害怕做的事情只有你一个人看到了,因为孤独往往意味着稀缺和正确。 * “只有犯错,才会有机会和自己相处”,才能真正知道什么是对的。 欢迎订阅「十字路口」播客 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我联合创办了街旁/新世相/躺岛,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。欢迎大家找我聊天,碰撞想法,链接下一个可能性。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 即刻 🎄 本播客由「新世相声音森林播客计划」支持。
“语言模型撞墙了,3D大模型刚开始”|和VAST创始人宋亚宸聊3D大模型创业“狂飙”的两年在文生图、文生视频的浪潮之外,下一个引爆我们想象力的 AI 技术奇点在哪里?答案可能是 AI + 3D。 本周,我们邀请 3D 大模型公司 VAST 的创始人和 CEO 宋亚宸(Simon),和我们聊聊 VAST 最新 3D 生成大模型 Tripo 3.0 背后的故事。 这位 97 年的创业者短期内连续融资三轮、每轮数千万美金,积攒了足够的子弹,在闷头苦干一年后,Simon 今年首次上播客,和我们探讨了几个关键的战略问题: * 他认为大语言模型已经“撞墙”,进化放缓,这才给了应用和 Agent 繁荣发展的空间。而 3D 大模型则完全不同,它才刚刚起步,仍是一片蓝海。 * 在资源有限的初创阶段,为什么 VAST 「既要又要」?既要研发大模型,又要自己下场开发应用 Tripo Studio? * 为什么科技的终极形态,是一场“解压缩”?他认为人类的媒介史(文字->图片->视频->3D)不是升维,而是因为技术所限,被迫对3D“源文件”世界进行的一次次降维和压缩。技术的进步,就是“解压缩”回世界本貌的过程。 * 以及,在一个机器人能代劳一切的未来,人的价值将如何被重新定义? 从小学时吸引同学们用辣条“充值”自己创造的纸上 RPG 世界,到 all in AI 创业打造一个坚信人人都会创造 3D 的“无限世界”梦想 ——欢迎收听 Simon 在创业路上的观察和思考,也欢迎你在评论区里说说你对 AI + 3D 的想法。 🟢 01:27 快问快答:**年龄、毕业院校、MBTI 和星座、一句话介绍现在的公司和产品、融资情况、收入和利润、团队规模、创业前经历 🟢 02:47 用 10 个「我是 xxx」来造句 1. 我是宋亚宸,也是 Simon 2. 我是 VAST 创始人兼 CEO 3. 我是一个上瘾的游戏玩家(Addictive Gamer) 4. ……剩下的 6 个更精彩,请收听播客 🟢 08:43 Part 1: 万物起源:从小学时收费的RPG,到一个无限世界的梦想 * 3D 大模型创业者的童年:手动创造 RPG 世界,同学们用辣条和豆腐干来“充值” * 核心驱动力:物理世界是有限制的,更大的世界来自于人的大脑、想象和创意的部分,那是一个无限的世界 * 最初的“钉子”:想做一个 UGC 的 3D 内容生态,但发现世界缺少一个大众级别的创作工具——就像文字缺少了输入法,视频缺少了手机摄像头。 🟢 26:14 Part 2: 模型 vs. 工作台:为什么我们既要造发动机,也要造F1赛车? * 一个关键的战略判断:当一个大模型还在以每 3-5 个月一次的速度飞速迭代时,纯做应用层的公司几乎没有生存意义,因为“它给你起了个新墙,你很难受” * 做模型也做做应用(Triple Studio):因为知道下一版模型的迭代方向,知道哪些旧墙应该糊,哪些不用 * 做大模型公司和做产品的本质区别:前者是拿着锤子找钉子,VAST 认为自己从第一天就不是 🟢 28:44 Part 3: AI 2.0 时代的生存法则:语言模型撞墙了,但 3D 没有 * 一个颠覆性观点:为什么现在涌现了大量 Agent 和应用?“我认为是 AI 1.0 时代死了,所以我在做 AI 1.0 的事情。” * AI 1.0 vs AI 2.0:前者是用天才科学家的手工调参训练无数小模型解决长尾问题;后者是用数据驱动训练一个通用大模型去泛化地解决所有问题 * 为什么 3D 领域几乎没有纯应用公司?“因为语言模型撞墙了,但 3D 还没 🟢 57:26 Part 4: 科技的终极形态,是一场“解压缩” * 我们以为互联网是升维(文字->图片->视频),但其实是降维和抽象——因为科技不够发达,我们被迫“压缩”了 3D 世界本来的样子 * 科技越来越发达,其实是允许它越来越解压缩。当它解压缩到极致,就是源文件 * 为什么人人都会做 3D?现在对我们而言很自然的拍视频、发照片,其实也不超过十年 * 3D UGC 平台的市场规模,应该是 Twitter、微博、小红书、抖音、TikTok 等平台加在一起的 2-3 倍 🟢 01:12:21 Part 5: 欢迎来到第四产业:当价值的唯一衡量标准是“体验” * 终极愿景:未来物理世界大部分的事情机器人都可以为人代劳,人的价值在于创意和内容 * 如何衡量价值——“所有的人在所有的时间中,在我们的世界里停留的总量” * 未来的“货币”是算力。你的世界越吸引人,你获得的“钱”就越多,你的推荐算法就越好,你就能创造更好的体验 * 一个来自《上传人生》的隐喻:现实中充的钱越多,虚拟世界就越流畅。未来也是这样,这就是算力 欢迎订阅「十字路口」播客 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我联合创办了街旁/新世相/躺岛,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。欢迎大家找我聊天,碰撞想法,链接下一个可能性。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 即刻 🎄 本播客由「新世相声音森林播客计划」支持。
1个AI Agent=4个工厂老师傅?|和王筱圃聊时序大模型和 toB Agent 这门生意今年我们关注了很多面向 ToC 用户的 Agent 产品,本周我们来聊聊面向 ToB 的 Agent,很可能 Agent 创造最大的商业价值不是在 ToC 而是在 ToB。 8 月底,AI Agent 被写入了国务院印发的《关于深入实施“人工智能+”行动的意见》。很多人认为,这是继十年前提出“互联网+”并且我们的生活被外卖、打车等等互联网+服务改变了之后,又一个前沿技术与各行各业结合的新的重要的机遇时刻。 接下来一段时间,「十字路口」也会做一系列相关的内容。 本周,我们关注 Agent 与工业结合正在发生的变化,我们邀请研发时序大模型 Geegobyte-g1 以及工业智能体平台「河谷」的初创企业极峰科技的创始人王筱圃,和我们聊一聊什么是时序大模型,和大语言模型的区别和具体的案例,他们如何训练一个 Agent 并把它卖给企业投入到生产流程中。希望能对大家了解 AI Agent 如何应用于工业生产有所帮助。 🟢 02:09 快问快答:年龄、毕业院校、MBTI 和星座、一句话介绍现在的公司和产品、融资情况、收入和利润、团队规模、创业前经历 🟢 03:21 时序大模型不是另一个 ChatGPT * 核心概念:大语言模型是跟人对话,时序大模型是跟未来对话 * 它的终极目标是让未来变得可预测、可管理和可优化 * 为什么工业场景需要一个“大”模型?——为了用一个通用模型,泛化地解决各行各业的问题 🟢 11:08 为什么要做? * AI 赋能工业,就像钢铁侠的智能助手贾维斯,我们专注的不是“设计战甲”,而是“生产战甲”的过程管理和控制 * 为什么刚性的自动化产线,依然离不开“老师傅”的临场反应 ? * 一个“数字工人(AI Agent)”最终要替代哪些角色?从设备操作员、运维人员到计划人员,实现从辅助到替代,再到超越 🟢 24:26 怎么做? * 一个反常识的切入点:不依赖对老师傅的访谈,因为人的语言表达会有信息的损失和偏差 * 训练 Agent 依赖什么?“第一性原理”和“永远不会撒谎的数据” * “数字工人”的大脑如何分工?大语言模型负责理解知识、能说会道;时序大模型负责模式识别、因果推理 * Agent 框架如同一个“神经回路”,将大脑、记忆和执行动作封装成一个可控、可观测的闭环流程 🟢 52:02 做出了哪些成果? * 在垃圾焚烧电厂,一个数字工人替代了原先需要 4 班 3 倒的 4 位师傅,实现了“无人值守” * 将技术采购转化为投资逻辑,给客户每年带来 400 到 500 万人民币的增量收益 * 一种颠覆性的商业模式:采用“劳务派遣”逻辑,客户按月为数字工人付工资,费用远低于被替代的人力成本 * 为什么这种模式是可持续的?它平衡了客户前期低投入的需求和供应商连续性收益的保障 🟢 01:09:40 未来呢?AI 会带来工业革命级别的改变吗? * 未来的工作流将如何重塑?人会从简单的操作人员,变成设计者、监督者和创新者 * 当技术工人被解放出来,会发生什么?投入到新工艺的研发中,为企业抓住转瞬即逝的市场风口 * 终极畅想:如果有一天,整个产业链的上下游由数字工人串联起来,其响应速度将带来“工业革命级别的改变” * 给 AI 时代创业者的一个认知:不要只扎根一个行业,而要利用大模型的泛化能力,专注于解决一种“跨行业的同种工艺问题” 欢迎订阅「十字路口」播客 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我联合创办了街旁/新世相/躺岛,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。欢迎大家找我聊天,碰撞想法,链接下一个可能性。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 即刻 🎄 本播客由「新世相声音森林播客计划」支持。
揭秘 Claude Code 榜一大哥:一个 AI 创业者如何把工具用到极致|对话刘小排本周十字路口的嘉宾是一位「榜一大哥」,不是某直播间的榜一大哥,而是 Claude Code token 消耗排行榜上的榜一大哥。 故事是这样的,两周前,Anthropic 上周发布一个公告:他们的工程师在后台数据中发现了一个异常账户,正在以一种不可思议的速度,7x24 小时消耗着 Claude 模型的算力。公告中提到:”有一位用户,在每月200美元的套餐中,消耗了价值 5 万美元的模型使用量。“ 这个消耗量大到,Anthropic 不得不公开发布声明调整全球用户的速率限制。 紧接着,这引发了全球科技圈的猜测和讨论:这个神秘的超级用户究竟是谁?他到底在用 Claude Code 做什么,能产生如此夸张的消耗? 就在所有人都好奇的时候,一个名叫刘小排的中国用户,在 X 上发帖认领了榜一大哥的身份:“Anthropic追杀的那个每个月消耗数万美金的人,原来就是我呀?!” 一瞬间,全球的目光都聚焦到了他身上。 他究竟是钻了系统空子的羊毛党,还是一个将AI潜力发挥到极限的超级玩家?天价账单的背后,隐藏着怎样的秘密? 今天,在「十字路口」,我们有幸请到了这位传说中的‘榜一大哥’——刘小排。他是一位优秀的 AI 创业者,他的三款产品 Raphael AI、AnyVoice、Fast3D 增长迅速、收入可观。 在本期内容中,他将和我们分享惊天消耗量背后的真相,以及作为一个非程序员出身的创业者,他是如何从0到1,利用AI独立完成产品洞察、开发到盈利的全过程。 🟢 03:09 快问快答:年龄、毕业院校、MBTI 和星座、一句话介绍现在的公司和产品、融资情况、收入和利润、团队规模、创业前经历 🟢 04:58 榜一大哥与天价账单 他到底是钻了系统空子的羊毛党,还是一个将AI潜力发挥到了极限的超级玩家? * 究竟用 Claude Code 干了什么成为全球榜一?一个人用77亿的Token,5万美金的账单… * 你为什么普普通通可以消耗到全球第一?背后是不是有一些不普通的用法? * 我们收入很不错,团队就六七个人,利润按照市场价格应该养活三五十人没问题 * 最开始,我以为 Claude Code 只比一个 Cursor 更厉害的 Cursor 而已 * 你怎么看大家说你“滥用规则”这一点? * 我已经过了在乎谁喜欢我、谁不喜欢我的那个年龄了 🟢 08:22 一套“非主流”的AI工作流 * 只要一件事情你敢有 SOP,那一定可以被 Claude Code 自动化 * 除了写代码,它还能做什么?——做 900 种风格的 AI 绘画,我睡了一觉就好了 * 它是一个广义的编程,你说这个是在编程吗?好像是,也好像不是 * 像 Manus 那样的工具是“有限集”;对我来说,Claude Code 是“无限集” * 经验分享:怎么让 Claude Code 不要把代码变成“屎山”? * 认真写需求文档,然后先跟他讨论方案 * 今天一切的创新都是站在前人的肩膀上 * 值得研究的三个进阶功能:后台命令、子 Agent 和输出风格 🟢 23:56 解锁刘小排的十个身份 一个「十字路口」的社交破冰新实验:请嘉宾用十个「我是…」的句式,完成一次“全景式”的自我介绍。 * 我是一个做AI产品的创业者 * 我是产品经理 * 我也是程序员 * 我肯定是个逗逼 * 我的「得到」学分比罗振宇高一分 * 我是 QQ 音乐上认证过的音乐人 * 我是全世界最会用 Claude Code 的人之一 * 我是一个孵化器的联合创始人 * 我是国内比较著名的独立开发者 * 我是“万死不辞打工狗”的精神偶像 🟢 33:30 从猎豹到旷野,一种人生方法论 * 在微软亚洲研究院,我发现了「科技」的秘密原来是两个词:科学和技术 * 猎豹成功的秘诀是他们一直相信简单 * 与 TikTok 前身 Musical.ly 创始人 Louis 做同事:”他居然把 4 个按钮减到 1 个“ * 怎么样扩大自己的运气面积? * 出来混最重要的是什么?是出来 * 多让自己接触到可能更多的变量,总有一些变量能够为你所用 🟢 46:33 创业者的“松节油” * 哪些场景用哪些模型? * 面对最高级的竞赛级别的算法,其实是 GPT 最强 * Gemini 对我来说更像一个架构师的角色 * 在这个时代做产品,和上一个时代有什么不一样? * 很多 AI 产品都很赚钱;但头部的 AI 产品不怎么赚钱,尤其是拿了投资的那些 * 对于那些想积极行动的人,你会给什么建议? * “It is not for you, It is you”——它不是为你而创造的工具,它就是你自己 * 人生是旷野,你有“矿”才能野 欢迎订阅「十字路口」播客 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我联合创办了街旁/新世相/躺岛,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。欢迎大家找我聊天,碰撞想法,链接下一个可能性。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 即刻 🎄 本播客由「新世相声音森林播客计划」支持。
AI 狂热之外,或许决胜局藏在“看不见”的地方 | 对话蚂蚁密算董事长韦韬:密态计算与高阶程序AI时代的聚光灯,不应只属于从零到一的创业者。 我们注意到一个有趣的现象:与热衷在全球舞台上表达观点的硅谷高管相比,中国的大厂高管们通常更倾向于低调行事。尽管如此,他们的平台掌握着丰富的资源、数据、人才和资本,他们的决策在切实地塑造着 AI 行业的未来发展。 「十字路口」希望做的,就是将这些身处一线的关键思考者,也带到你的面前。 上周,我们与阿里云副总裁旭卿的对话收到了不错反响;本周我们又迎来了另一位具有传奇色彩的重量级人物:蚂蚁集团副总裁、首席技术安全官,同时也是蚂蚁密算董事长的韦韬。 说韦韬是位“传奇极客”毫不为过。他是影响了一代留学生的精神家园——MITBBS(未名空间)的发起人之一;他也是一位坚定的开源信徒,自称“读着开源代码长大”,并始终致力于用自己的方式回馈社区。 这场对话源于「隐语」开源社区的三周年,韦韬和我们分享了很多日常可能不被大家关注、但非常关键的两个点: * 密态计算 (Cryptographic Computing): 一种能让数据“可用不可见”的技术,在保护隐私的前提下,让数据价值安全地流动起来,喂养出更强大的AI。 * 高阶程序(High-Order Program) : 一套全新的工程化思想,通过任务拆解和自动核验,构建可靠的保障框架,让它的每一次输出都变得可靠、可控。 「十字路口」讨论了大量模型、应用与infra,而本期内容我们之所以要把焦点放在这两个部分,是因为在 AI 的狂热之下,它们或许正是决定 AI 能否真正走向工业化、赢得长期信任的决胜点所在。 这也为今天的 AI 创业者和投资人指明了下一个可能的价值高地:当模型的“聪明”本身正变得越来越像普通商品,那么通过新技术、新办法去”构建信任、确保可靠“,或许才是建立真正商业壁垒和长期价值的关键。 👬🏻 图为录制现场 🟢 Part 1 韦韬的故事 0:55: 北大“宝藏男孩”,和一段被遗忘的互联网往事 03:21 最近喜欢的 AI 产品是什么? 10:00 什么?大模型的幻觉是“必要的”? 11:17 创立 MITBBS 的故事 —— “写站规比写情书还认真?” 15:53 黑灰产攻防的精彩往事 18:24 普通人保护隐私成本最低的一招(不是改密码) 🟢 Part 2 “看不见”的技术,如何改变世界? 24:24 密算是什么?跟普通人有什么关系? 28:47 不同技术路线之争 31:48 内部激辩:我们为什么要将核心技术「开源」? 33:13 密算如何帮农民解决贷款难题? 36:46 如何让新能源车保费降下来? 🟢 Part 3 用高阶程序驯服 AI 40:19 密态计算和大模型的关系是什么? 43:35 你用大模型的方式,还停留在“手工作坊”时代吗? 45:49 管控AI、让它不再“胡说八道”的三个“紧箍咒”是什么? 48:36 “高阶程序”和密算的关系是什么? 🟢 Part 4 挑战与未来 52:03 成为密算董事长后,面临哪些新挑战? 58:22 “吃螃蟹”的生意:如何让客户相信,螃蟹真的很好吃? 01:01:31 最初接触开源社区的经历?——“我们回应了期待,没有辜负善意” 01:06:53 发起「隐语」开源社区的目标? 01:09:13 隐语社区 3 年来最有成就感的事:非洲手机巨头的加入 01:21:40 有没有被 AI 带来的冲击影响? 01:23:54 高级程序员才能幸存?不,初级程序员迎来了最好的学习时代 欢迎订阅「十字路口」播客 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我联合创办了街旁/新世相/躺岛,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。欢迎大家找我聊天,碰撞想法,链接下一个可能性。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 即刻 🎄 本播客由「新世相声音森林播客计划」支持。
AI 是具身智能的胜负手吗?半年融资3亿后,VBot 首款产品做得怎么样?|对谈维他动力联创赵哲伦上周,北京的 WRC 世界机器人大会史无前例的火爆。 维他动力半年内融资 3 亿人民币,带着新产品首次亮相,因其独特性成为了全场最多人排队的展位之一。 维他动力的联合创始人赵哲伦(哲伦班长)很兴奋,他认为: 最多十年,中国的机器人大会也许就可以类比当年的伦敦世博会 ——1851 年的伦敦世博会是第一届世界博览会,在长达 5 个月的展览期内,吸引超过 600 万参观者,展品中也包括引擎、纺织机械等现代工业的标志性创造。 本期节目,我们邀请赵哲伦和我们分享他在世界机器人大会上的见闻,也和我们梳理自波士顿动力发布第一款机器狗至今,机器人行业的的演进与关键技术,以及,他参与创办的维他动力,如何做出第一款摆脱遥控器的机器狗:他们如何做技术路线选择,如何看待今年的目标。 此外,哲伦也和我们讲述了他为什么会离开理想汽车去创业,机器人对孩子的启蒙、机器人文化以及他对未来机器人行业发展前景的预测。 02:05 十字路口 v.s. 哲伦班长 快问快答 03:43 刚参加完 WRC 世界机器人大会的感受 06:28 「最多十年,世界机器人大会也许会成为当年的伦敦世博会」 08:58 归纳机器人意味着什么:它提供了某种程度上的空间移动方式 10:50 从波士顿动力发布第一款机器狗至今,机器人行业演进 11:37 第一阶段:以波士顿动力为主导,第一次让人通过遥控器控制足的行动 12:53 第二阶段:以宇树为代表,结合中国供应链优势,在机器人整体结构上做精巧设计 15:20 今天进入第三阶段,在三个技术成熟的条件下 17:48 宇树科技王兴兴:VLA 是一个相对傻瓜的架构,采用 VLA 架构的维他动力怎么看? 20:03 为什么维他动力选择做机器狗而不是做机器人? 24:03 选 ToC:要交付面对用户服务的产品,联创个人经历,考虑公司的组织方式和工作方法 27:05 研究机器人究竟能为用户做什么:全网找人做用户调研 29:35 第一年追求的关键指标:NPS(Net Promoter Score净推荐值)和出货量 31:38 希望用户可以把维他动力的机器狗带出门 33:18 为什么创业者不选这个领域? 34:11 参考样本少,创业中遇到的意想不到的困难 37:42 机器人创业有两条技能线要走,宇树也有它的挑战 39:46 在理想工作这么久,为什么会考虑创业? 41:30 非常希望自动驾驶有一天能做到 L4 43:29 特别想做机器人,在理想的时候就常常找人沟通 44:22 和李想工作的感受 46:41 创业后和李想聊产品、品牌的收获 49:35 创业选择虽然多,但是也受限,因为最重要的投入就是时间 52:00 也可以靠自己做内容,但希望能找到伙伴做更大的事情 52:58 创业中的起起伏伏 56:04 机器人面向 C 端最有希望并且有商业价值的用户场景会是哪个? 58:31 特斯拉的做法是远程遥控机器人做事再积累数据,这个做法可能只适合特斯拉 01:00:35 业内讨论目前更多关注技术的进一步发展 01:03:10 对今年世界机器人大会最感触的是有很多孩子参与,也许这是他们的机器人启蒙 01:05:03 为什么机器人要去跑步,踢足球?我们需要一种类似汽车文化的机器人文化 01:07:16 现在机器人行业有泡沫吗? 01:12:22 对未来机器人行业的预测,也许会很像《机器人总动员》 欢迎订阅「十字路口」播客 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我联合创办了街旁/新世相/躺岛,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。欢迎大家找我聊天,碰撞想法,链接下一个可能性。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 即刻 🎄 本播客由「新世相声音森林播客计划」支持。