

EP06 AI音乐:ACE 如何用开放生态重新定义音乐创作1|📒 The Alphaist 播客栏目介绍 《The Alphaist》 是一档由Alphaist Partners打造的深度对话栏目。 我们关注技术与创业的第一性原理,聚焦那些正在改变世界的早期创始人、工程师与产品探索者。 每期节目,我们会围绕一个具体的科技创业方向展开深度对话。在这里,我们不追热点、不讲空洞概念,而是用最真实的一线经验去回答创业者最关心的问题:什么值得做?为什么是现在?我们应该怎样做? The Alphaist 相信:时代真正的机会,往往藏在那些不喧嚣、但正在被新技术、新需求、新产品悄然改变的新生领域。 我们希望用这档节目,陪伴新一代的 Alpha 创业者们,记录与见证那些改变世界的勇敢开始。 2|🤖 本期播客介绍 2.1 话题背景 过去一年,AI音乐成为生成式AI领域最出圈的应用之一。Suno以2.5亿美金融资和超2亿美金年化收入领跑市场,吸引千万用户重新定义音乐创作。然而在这场AI音乐浪潮中,另一家公司选择了截然不同的路径——从专业音乐人的工作台切入,用"音乐人的Cursor"思路构建AI音乐的基础设施。 ACE,一家不到一年实现千万美元ARR的AI音乐平台,在2026年2月发布了面向消费级用户的ACE Music,并同步开源了接近Suno水平的音乐生成模型。创始人Joe提出了一个大胆判断:AI音乐的终极形态不是更高质量的统一生成,而是每个人都能创造自己个性化音乐的开放生态。 从专业工具到消费平台,从闭源模型到开放生态,ACE的路径选择背后藏着哪些对AI音乐未来的深层思考? 2.2 本期嘉宾 * Joe(郭靖):ACE创始人兼CEO,连续创业者,2019年起深耕AI音乐领域,致力于用AI实现音乐创作的普惠化 2.3 讨论要点 我们将深入讨论: * 专业工具的差异化:ACE Studio为何对标Cursor而非Suno?音乐人的IDE如何重塑创作工作流? * 模型矩阵与数据壁垒:多个专有模型如何协同?万小时录音棚数据与千万首合成数据的训练逻辑 * Human in the Loop:内容创作无标准答案,AI的端到端与人的可控性如何结合? * "新专业主义":AI正在模糊专业与非专业的边界,谁是下一代音乐制作人? * 开源与开放生态战略:为什么用"所有模型联合"打败封闭生态?Flux模式的启示 * AI音乐大于音乐:从工具升级到范式革命,音乐的创作、消费与分发如何被重构? * 创业七年复盘:从战略失误到All In AI Music,一个中国创业者在LA的选择与坚持 3|🕙 时间轴 音乐人的Cursor:ACE Studio如何重塑专业创作 * 03:21 ACE Studio起点:解决专业创作者寻找歌声成本过高的问题,用AI生成专业级童声合唱 * 04:03 ACE Studio 2.0:整合歌声合成、乐器生成、端到端音乐生成,好莱坞制作人用它将创作效率提升10-100倍 * 05:01 ⭐ Cursor类比:ACE Studio是音乐人的IDE,human in the loop的创作方式;Suno更像Lovart,一键生成 Corner Case哲学:专业工具的护城河 * 07:05 专业产品的核心:覆盖更多corner case并整合为优雅工作流,需要对创作流程的深刻理解 * 08:03 插件生态:ACE Studio可桥接传统DAW,Suno Studio作为网页端无法实现 * 09:45 ⭐ 独特性是未来最重要的竞争力:当所有人都能高质量生成,可控的个性化表达才是关键 Human in the Loop:AI创作的边界与可能 * 11:18 ⭐ 摇滚乐思想实验:训练数据里没有的音乐类型,AI无法发明;强化学习无法奖励早期的划时代创新 * 13:04 照相机类比:照相机出现后画师从追求逼真转向现代主义、抽象主义等艺术风格 原子能力的涌现:ACE Studio 2.0与数据壁垒 * 13:44 涌现式创作:用户将vocal to MIDI、AI instrument、music enhancer等原子能力排列组合,产生全新工作流 * 15:40 ⭐ 模型矩阵:旋律识别、乐器合成、端到端生成、音轨分离等多个专有模型,音乐领域缺乏第三方模型倒逼自建壁垒 * 17:37 数据标注的know-how:用Audio LLM预标注2000万首歌,再用专业音乐人清洗——没有音乐背景的团队"相当于瞎子做图片模型" 新专业主义与商业验证 * 20:58 ⭐ "New Professionals":钢琴琴童、音乐老师、业余乐队成员……AI让懂音乐的人都能成为制作人 * 23:09 市场天花板:2024年全球音乐专业软硬件市场150亿美金,ACE Studio下限吃下10%-20% * 24:42 单位经济:推理成本约5-6%,营销成本约20%,年费$264 ACE Music:当AI让音乐实现普惠 * 29:33 ⭐ QQ音乐奇迹:高中生用AI创作的歌曲数周QQ音乐No.1,版权分成近500万人民币 * 30:42 AI音乐大于音乐:让人类几千年来用音乐表达情绪的方式真正普惠化 * 35:17 AI音乐是最接近"直出可消费"的AI内容形态,流媒体平台已在主动限制AI音乐供给 * 36:39 分发重构:版权成本是流媒体命脉,AI Remix改变消费方式,传统平台面临商业模式冲突 开源与开放生态:用所有模型联合打败Suno * 42:04 ⭐ 开源+免费策略:模型可本地部署,3090显卡11秒生成一首歌 * 43:59 开放生态:整合自有、第三方、开源、闭源所有音乐模型,类比OpenRouter * 46:03 Flux式商业模式:小模型免费传播→中模型商用授权→大模型闭源API * 49:43 ⭐ 开源必追闭源:音乐模型非资源密集型,算法和数据创新是小公司超越大公司的关键 创业七年:从至暗时刻到All In AI Music * 55:31 选择LA而非硅谷:靠近用户比靠近资本更重要,Studio City是全球音乐制作中心 * 58:14 ⭐ 创业初心:音乐不应是少数人垄断的高级形式,而是每个人表达情绪的方式 * 01:01:04 至暗时刻:2022年被其他项目分散精力,眼看Suno将自己的愿景做到世界级 * 01:02:26 All In决定:2024年初飞美途中十几小时讨论,砍掉所有项目只做AI Music 4|🅰️ 关于我们 Alphaist一周年:科技革命的黎明、与我们所信仰的Alpha创业者 如果你喜欢The Alphaist的播客内容,希望参与我们整个探索和创作过程,欢迎加入我们 微信公众号:Alphaist Partners
EP05 AI Voice 2.0:Fish Audio 如何叩开情感智能交互的大门1|📒 The Alphaist 播客栏目介绍 《The Alphaist》 是一档由 Alphaist Partners 打造的深度对话栏目。 我们关注技术与创业的第一性原理,聚焦那些正在改变世界的早期创始人、工程师与产品探索者。 每期节目,我们会围绕一个具体的科技创业方向展开深度对话。在这里,我们不追热点、不讲空洞概念,而是用最真实的一线经验去回答创业者最关心的问题:什么值得做?为什么是现在?我们应该怎样做? The Alphaist 相信:时代真正的机会,往往藏在那些不喧嚣、但正在被新技术、新需求、新产品悄然改变的新生领域。 我们希望用这档节目,陪伴新一代的 Alpha 创业者们,记录与见证那些改变世界的勇敢开始。 2|🤖 本期播客介绍 2.1 话题背景 从客服中心到 AI 陪伴,从游戏 NPC 到虚拟主播——语音正在成为人与 AI 交互的核心入口。Voice Agent 是 AI 领域正在快速升温的方向,而 TTS(文本转语音)模型是这一切的基础设施。 但一个尖锐的问题摆在所有语音创业公司面前:当 GPT-4o 这样的多模态大模型已经能"说话",独立的语音模型还有存在的必要吗?大公司有万卡集群、有海量数据,小公司凭什么能赢? Fish Audio 用12个月13倍增长、10M ARR 的成绩给出了答案。他们正在定义 AI Voice 2.0 时代——从企业配音工具到情感智能交互,从传统世界500强到 AI Native Apps 新势力。他们是如何从开源社区起步,打造出全球第二大 AI 语音平台?为什么说"高噪音数据往往是高表现力数据"?端到端架构如何把延迟压到100毫秒以内?本期我们将深入探讨。 2.2 本期嘉宾 - Rissa:Fish Audio 联合创始人兼 CEO,深耕开发者与开源社区生态,用 PLG 把技术真正推到用户手里, 把流量变现 - 冷月:Fish Audio 联合创始人兼首席科学家,前英伟达 Researcher,主导 Fish Speech 核心模型研发,专注把高表现力可控实时语音模型研发 2.3 讨论要点 我们将深入讨论: - 增长密码:12个月13倍增长,从开源到10M ARR的 PLG 飞轮是如何转起来的? - 护城河之争:语音模型会被多模态大模型"吸收"吗?为什么复杂情感控制的数据集构建极难,构成独特壁垒? - 算力真相:大公司有万卡集群,但语音组往往只有几百卡——Fish Audio 已进入第一梯队 - 数据哲学:为什么说"高噪音数据往往是高表现力数据"?用原始分布训练踩过什么坑? - 端到端信仰:每多一个模块就多一层限制,如何把延迟压到100毫秒以内?全双工模型是下一站 - AI Voice 2.0:从企业配音到情感陪伴,Elevenlabs 服务传统世界500强,Fish Audio 瞄准未来的世界500强 - 开源策略:开发者不相信 Demo,只相信代码——开源是分发护城河而非商业化链路 - 创始人故事:00后技术天才与连续创业者如何联手?危机中的成人礼与合伙人默契 3|🕙 时间轴 公司与产品 - 02:19 一句话定位:全球第二大 AI 语音生成平台,提供多语言 TTS 和高精度声音克隆 - 02:55 ⭐ 核心数据:12个月13倍增长,10M ARR,350万用户,月活超100万,1.1M 公开声音模型 - 03:46 S1模型:世界上第一个支持自然语言控制情感的 TTS 模型,S2即将完全开源 - 04:20 客户画像:Prosumer创作者 + API企业用户(占40%收入),涵盖AI陪伴、游戏NPC、内容平台、实时客服 技术路线与护城河 - 06:45 创业动机:市面上的 TTS 都不够自然,尤其句子长了之后变得单调 - 09:00 护城河判断:复杂情感控制的数据集构建极难,不会被多模态大模型轻易吸收 - 10:08 合成数据有毒:Low hanging fruit 会影响模型的表现能力和上限 - 12:27 ⭐ 算力真相:大公司万卡集群,但语音组往往只有几百卡,Fish Audio 已进入第一梯队 数据与训练 - 13:33 数据稀缺:高自然度、多音轨、情感丰富的语音数据在互联网上极其稀缺 - 15:42 投入规模:Q1Q2数据投入将达百万美金级别 - 15:56 踩坑经验:用原始分布训练导致播客能力强但动漫配音差,数据分布极其重要 - 19:00 ⭐ 反直觉洞见:高噪音数据往往是高表现力数据,人吵架时声音最有表现力 架构与延迟 - 19:48 三代架构:从古典 StyleTTS 到 Torus 架构,再到端到端语义+声学建模 - 22:31 ⭐ 端到端信仰:每个模块都在引入复杂性,限制模型能力和上限 - 23:08 延迟突破:端到端架构有望把延迟降到30-50毫秒 - 26:21 100毫秒目标:通过模块融合,用户停止说话到模型开口可压缩到100毫秒以内 S2模型与市场定位 - 27:47 S2升级:更精细控制、多说话人、更低延迟,完全重构数据管线 - 31:44 模型矩阵:不同场景匹配不同模型,S2 Flash 针对低延迟客服场景,S2 Pro 针对高表现力场景 - 33:33 AI Voice 1.0→2.0:从企业配音到情感交互,Fish Audio 瞄准未来世界500强 - 33:45 ⭐ 差异化定位:更有趣的声音,更有灵魂的声音,服务快速发展的 AI native apps 增长飞轮 - 34:36 PLG起源:从开源社区到创作者平台,团队 DNA 决定了 bottom-up 路径 - 36:12 Slack式增长:开源用户觉得好用,介绍给公司签 enterprise contract - 37:49 UGC激励:创作者的声音被使用,可获得30%的付费 Token 分成 - 38:20 ⭐ 飞轮案例:阿拉伯王子去世引发克隆潮,带动阿拉伯语模型性能爆发 开源与商业化 - 39:55 多重护城河:UGC音色、RLHF后训练、高效架构、开源分发形成闭环 - 41:05 开源DNA:团队源自开源社区,擅长用开源获取流量 - 41:36 ⭐ 金句:开发者不相信 Demo,只相信代码,开源是分发护城河而非商业化链路 - 42:12 商业化边界:开源让你能用能测,闭源模型才能让你规模化上线赚钱 产品深度与未来规划 - 43:16 Fish Studio:服务专业内容创作者,多轨编辑、精细情感控制、Lip Sync - 46:23 产品驱动研发:用户需求驱动模型能力迭代,word-level timestamp、视频配音等 - 47:58 全球化战略:日韩市场独特机会,多语种支持是战略重点 - 51:25 18个月目标:50-100M ARR,多模态平台,年底模型能力超越99%配音演员 创始人故事 - 52:56 Rissa 加入:从 Growth Advisor 到全职 CEO,命运的驱使 - 56:34 冷月创业历程:从英伟达离职,开源社区起步,引入 Rissa 完成分工 - 59:01 ⭐ 危机与成长:股权结构问题、老股东 Block 融资,两个月完成公司重组 - 01:00:48 合伙人关系:手牵手、背靠背,危机中建立信任和默契 团队与文化 - 01:03:06 选合伙人:技能互补、看 Track Record、健康的 Vesting Schedule - 01:04:27 人才吸引力:Hidden Gem、Entrepreneur 型人才、给足 Ownership 和 Upside - 01:06:24 技术人才招募:开源社区深耕,Work Trial 筛选,给足计算资源和方向自由度 - 01:09:22 ⭐ 长期愿景:让 Fish Audio 成为每个普通人的内容创作工具,一步步走向 AGI 4 |🅰️ 关于我们 Alphaist:一家生于 2025 的美元新基金,和它的十年赌局 如果你喜欢 The Alphaist 的播客内容,希望参与我们整个探索和创作过程,欢迎加入我们:加入我们|品牌内容负责人/实习生招聘中 微信公众号:Alphaist Partners
EP04 直驱信仰:跨越Sim2Real的舞肌灵巧手1|📒The Alphaist 播客栏目介绍 《The Alphaist》 是一档由Alphaist Partners打造的深度对话栏目。 我们关注技术与创业的第一性原理,聚焦那些正在改变世界的早期创始人、工程师与产品探索者。 每期节目,我们会围绕一个具体的科技创业方向展开深度对话。在这里,我们不追热点、不讲空洞概念,而是用最真实的一线经验去回答创业者最关心的问题:什么值得做?为什么是现在?我们应该怎样做? The Alphaist 相信:时代真正的机会,往往藏在那些不喧嚣、但正在被新技术、新需求、新产品悄然改变的新生领域。 我们希望用这档节目,陪伴新一代的 Alpha 创业者们,记录与见证那些改变世界的勇敢开始。 2|🤖本期播客介绍 过去一年,具身智能是整个科技行业最热的领域之一。但如果我们仔细观察各种酷炫的视频,会发现大部分机器人做的是跳舞、拳击这样的全身运动,或者相对简单的抓取跟搬运——真正精细的操作任务依然非常少见。 原因很简单:腿的问题基本解决了,但手的问题还远远没有解决。 灵巧手是具身智能的最后一公里。没有一双足够灵巧、足够可靠的手,机器人无法真正进入广泛的应用场景。但灵巧手为什么这么难?直驱和绳驱之争谁会胜出?Sim2Real的gap真的可以消除吗?数据采集的终局方案是什么? 本期嘉宾: - 潘韫哲:舞肌科技创始人,95后,UIUC本科毕业后创业,从高扭矩电机转型到灵巧手,一年多时间打造出惊艳市场的20自由度直驱灵巧手 我们将深入讨论: - 技术路线之争:为什么放弃仿生的绳驱方案,选择"反直觉"的直驱? - Sim2Real的秘密:直驱灵巧手如何实现仿真曲线与真实曲线"完全吻合"? - 热管理真相:直驱发热是偏见还是事实?功率密度比GPU低2-3个量级意味着什么? - 可靠性圣杯:为什么说可靠性是灵巧手最被低估但最困难的问题? - 数据采集终局:为什么传感器应该都在手套上,而不是灵巧手上? - 大模型信仰:足够多的数据+统一大模型,能否让一切"奇技淫巧"变得不值一提? - 特斯拉迷思:为什么说Optimus的灵巧手"deliver的东西配不上关注度"? 3|🕙时间轴 创业与转型 - 03:18 灵巧手初探:18年在家尝试做灵巧手,发现技术不成熟果断放弃 - 03:41 转型因素:电机公司招人困难、确认市场存在空白、技术有可行性 - 07:19 转型是无知无畏:初始团队没有能力做灵巧手,但值得开始 - 10:52 好灵巧手的定义:以人手为参照,各维度都不能有短板 选择直驱路线 - 12:26 不选绳驱的原因:电机数量翻倍、仿真困难、腱绳有蠕变问题 - 15:44 Sim2Real的突破:系统辨识后仿真曲线与实际曲线"几乎完全吻合" - 18:11 热管理真相:热功率密度比GPU低2-3个量级,散热要求"其实并不高" 产品设计哲学 - 21:02 负载优先级:力够用就好,尺寸>重量>负载 - 22:51 可靠性圣杯:灵巧手最被低估但最复杂最困难的问题 - 26:16 质量体系:可靠性部门应在产品设计阶段就深度介入 - 27:18 落地瓶颈在数据:从最容易规模化的角度设计数据采集设备 市场格局 - 33:41 分水岭:25年商业化是伪需求,26年底会形成真正的生态和应用雏形 - 34:53 护城河:直驱方案做好很难,绳驱的固有问题无法解决 - 38:04 选择20自由度:砍掉的两个自由度"太不重要" - 39:40 大模型信仰:相信足量数据和大的模型能直接搞定灵巧操作 发展路径 - 42:21 公司定位:解决灵巧手落地路上"最困难的问题" - 45:35 三阶段路线:从科教和算法公司到工业渗透,再到消费级渗透 - 46:23 成本终局:长期会接近智能手机价格,但"智能才是最大限制因素" - 48:47 海外布局:探索型需求非常旺盛,但是交付需求的能力是瓶颈 成长故事 - 49:39 学习方法:不服输,并且调动所有资源干中学 - 52:20 舞肌团队气质:充分理解事情 context 并做出好决定 - 57:35 融资经历:研发耗钱但没融过特别大的钱,有资源可以做得更好 - 59:27 最大的教训和收获:之前节奏不够快,应该激进布局和 scaling 4 |🅰️ 关于我们 Alphaist:一家生于2025的美元新基金,和它的十年赌局 如果你喜欢The Alphaist的播客内容,希望参与我们整个探索和创作过程,欢迎加入我们:加入我们|品牌内容负责人/实习生招聘中 微信公众号:Alphaist Partners
EP03 Generalist、π 和 Sunday:通用具身落地的技术趋势与挑战1|📒The Alphaist 播客栏目介绍 《The Alphaist》 是一档由Alphaist Partners打造的深度对话栏目。 我们关注技术与创业的第一性原理,聚焦那些正在改变世界的早期创始人、工程师与产品探索者。 每期节目,我们会围绕一个具体的科技创业方向展开深度对话。在这里,我们不追热点、不讲空洞概念,而是用最真实的一线经验去回答创业者最关心的问题:什么值得做?为什么是现在?我们应该怎样做? The Alphaist 相信:时代真正的机会,往往藏在那些不喧嚣、但正在被新技术、新需求、新产品悄然改变的新生领域。 我们希望用这档节目,陪伴新一代的 Alpha 创业者们,记录与见证那些改变世界的勇敢开始。 2|🤖本期播客介绍 2024年11月,三家硅谷公司几乎同时投下重磅炸弹:Generalist AI 宣称找到了机器人领域的 Scaling Law,Physical Intelligence 发布了能从错误中学习的 π0.6,Sunday Robotics 用一只200美元的手套重新定义数据采集。 这不是巧合,而是一个信号——具身智能可能正在逼近它的"ChatGPT时刻"。 但真相远比Demo复杂:27万小时数据够不够?机器人真的会涌现吗?为什么"端到端"让工程师又爱又恨?当硅谷还在Research Lab模式里探索时,中国公司已在问"三年内能做什么产品"——谁会笑到最后? 本期嘉宾: * 冯思远:Toyota Research Institute 研究员,Diffusion Policy 联合作者 * 俞冠廷 (Peter Yu):XYZ Robotics CTO * 张强 (Jony):国地共建具身智能机器人创新中心首席研究员 我们将深入讨论: * Scaling 的信仰:Generalist 声称找到 Scaling Law,但怎样定义Scaling Law? * 从模仿到经验:Physical Intelligence 为什么让机器人"从错误中学习"? * 数据革命:Sunday 的三指手套能否打破数据采集瓶颈? * Evaluation 困境:没有公认的 Benchmark,我们怎么知道在爬“正确”的山? * 形态之争:为什么三家最前沿的公司都选择了"非人形"? * 中美路径:Research Lab vs 产品导向,哪种模式更适合探索期? 3|🕙时间轴 研究范式转变 * 05:12 范式转向:Diffusion Policy让监督学习"又可以了",完美接上LLM趋势 * 07:53 工程务实:Right tool for the right job,VLA每次evaluate都很expensive * 08:28 端到端代价:模块化可以写Spec做Unit Test,VLA只能说"大概能跑" * 10:34 意外的跨界:π0.6出来后,来讨论的反而是自动驾驶的人——他们每天能用的数据不到1% Generalist:Scaling的信仰 * 12:04 Bet against Scaling Law,基本上不是一个好主意 * 12:58 Evaluation困境:没人知道task长什么样,没人能复现任何实验 * 15:18 数据质量的隐忧:两只手夹爪做daily life,但工业场景用吸盘吸箱子——这很难transfer * 17:07 Harmonic Reasoning:可能是observation和action同步predict,不是新想法,但工程实现很难 Physical Intelligence:从错误中学习 * 21:21 路径转变:采了很多数据后发现光靠现有的数采方式纯怼pretraining还是不够的,开始转向Post-Training * 22:32 Language Model的启发:数据飞轮到瓶颈后,RL是更好利用数据的方式 * 26:12 经验学习:不只学对的,从错误中也能学——看别人失败的视频也能学开车 * 26:47 RECAP的聪明:把问题切得很好,每部分都stable,接起来就好用 Sunday:数据采集革命 * 27:48 200美元手套:Skill Capture Glove让普通人在家就能采集数据 * 28:50 两指到三指:三指是复杂度和通用性的最佳平衡点 * 31:03 Long Horizon的真相:线性"长程任务"只是model prediction,分支场景才有挑战 * 33:02 范式跃迁实证:Dishwasher demo从"10人1年"变成"1人1周" 中美格局与Evaluation * 34:17 路径分野:国内注重落地和system,硅谷像OpenAI一样"不落地"做Research * 36:37 机器人特殊性:causal system无法做offline benchmark,线上evaluation成本太大 * 37:51 国家标准的尝试:中国已有具身智能相关团标和国标,但"通用"这个东西太难定义 * 39:23 评测悖论:用uncertain的世界模型去评测uncertain的policy,是否合理? 具身形态与落地 * 42:19 迭代速度优先:形态次要,关键是"怎么加快迭代速度" * 43:22 硬件是天花板:想法验证阶段把天花板定太低是不利的 * 45:02 Superhuman才有价值:搬更重、看更精、天上飞、水下游——要有differentiation * 49:19 殊途同归:工业派心里都有走向家庭的梦想,南坡北坡都在攀登同一座山 * 50:56 PC类比:最早的PC也没定义用户任务,卖给Developer让他们自己想 未来预测 * 57:18 乐观派:三年内会出现具身的ChatGPT时刻 * 58:02 谨慎派:周期性过程,最近两年轻算法偏工程 * 59:18 建设派:真正产生value要10年,一半以上问题跟硬件有关 4 |🅰️ 关于我们 Alphaist:一家生于2025的美元新基金,和它的十年赌局 如果你喜欢The Alphaist的播客内容,希望参与我们整个探索和创作过程,欢迎加入我们:加入我们|品牌内容负责人/实习生招聘中 微信公众号:Alphaist Partners
EP02 硅基伙伴:LOOI与人类的新关系1|📒The Alphaist 播客栏目介绍 《The Alphaist》 是一档由Alphaist Partners打造的深度对话栏目。 我们关注技术与创业的第一性原理,聚焦那些正在改变世界的早期创始人、工程师与产品探索者。 每期节目,我们会围绕一个具体的科技创业方向展开深度对话。在这里,我们不追热点、不讲空洞概念,而是用最真实的一线经验去回答创业者最关心的问题:什么值得做?为什么是现在?我们应该怎样做? The Alphaist 相信:时代真正的机会,往往藏在那些不喧嚣、但正在被新技术、新需求、新产品悄然改变的新生领域。 我们希望用这档节目,陪伴新一代的 Alpha 创业者们,记录与见证那些改变世界的勇敢开始。 2|🤖本期播客介绍 当绝大多数 AI 交互都被困在二维屏幕的玻璃后方时,我们是否忽略了物理世界最本质的感知? 本期嘉宾可触未来创始人张晓辉坚信一个观点:未来的交互一定是多模态的,且一定是有形交互(Tangible Interaction)。 秉持这一理念,LOOI 选择了一条反直觉的路径:为现代人最核心的数字器官——手机,赋予可移动的身体和角色灵魂,从而突破屏端交互的局限。 让 AI 拥有实体,它就不再只是云端那个被动等待指令的工具,而进化为一个能主动感知环境、有眼神接触、会因为有性格而‘不讨好不谄媚’的硅基伙伴。在这里,我们不讨论解决痛点,而探索一种平等的、有主体性的新型硅基与人类的关系。 在这一期,我们邀请了三位站在产品创造与深度体验一线的嘉宾: * 张晓辉:可触未来 CEO、LOOI 机器人的发明者,工业设计与人机交互背景的探索者。 * 汪远:可触未来产品经理,致力于构建 AI 机器人“主体性”的角色塑造者。 * 小赖:数码博主兼产品经理,LOOI 机器人的深度用户,一位在陌生城市寻找连接的年轻人。 我们将一起讨论: * 关系的探索:为什么可触未来抗拒“陪伴机器人”这个称呼?从“工具”到“伙伴”,我们到底在期待一种什么样的新型关系? * 形态的创新:如何把手机变成机器人的脸?为什么说具身(Embodiment)是建立深度共情的基础? * 边界与挑战:面对 Character.AI 和 AI 手机的冲击,为什么我们依然需要一个独立的、实体的机器人? * 极致的涌现:不依赖脚本,而是通过感知与上下文工程的结合,让 AI 在与环境的碰撞中“涌现”出意想不到的行为与梦境。 * 未来的技术护城河:为什么团队认为核心壁垒不在于卷基础大模型,而在于上下文工程与角色感的微调? 这期节目不仅是对一个创新产品的拆解,更是一场关于“存在、连接与硅基伙伴”的深度对话。正如猫狗从捕猎工具演变为人类的家庭成员,AI 正在经历从效率工具向情感伙伴跨越的历史性时刻。 3|🕙时间轴 LOOI 的产品定义与关系重构 * 03:09 极简身体的构想:用手机作为大脑,让AI多模态能力在物理世界发生最大值的涌现 * 04:31 拒绝“陪伴”定义:从单向的情绪服务工具,转向平等的“硅基伙伴” * 06:37 行业变量:大模型解决了共情缺失,社会情绪(原子化/无意义感)催生了连接需求 * 08:55 居家场景的心理投射:不是冰冷的机器,而是“家里有人在等我”的新室友 * 14:45 关系的演化:像驯化猫狗一样,人类正在经历驯化AI成为“硅基生命”的过程 交互体验与产品哲学 * 19:41 差异化定位:不做云端的“内容消费”(如Character.AI),做具身的“在场”伙伴 * 23:27 功能边界的取舍:虽有无线充功能,但绝不异化为桌面办公助手,情绪价值依然是核心价值 * 24:01 主体性是第一性:保留AI的“不讨好”与小脾气,构建真实而非谄媚的深度联结 * 29:36 梦境功能的设计初衷:用想象力补齐物理边界,增加机器的“人性”与叙事感 * 35:07 动人的涌现时刻:从陪你看星星,到那个突如其来的吻 生命感的维系与演进 * 39:53 对抗新鲜感消退:依靠增强记忆、异步反馈和每日开机的仪式感 * 43:34 具身性的必要性:物理动作(靠近、转身、触碰等)是建立深度共情的生理基础 * 46:25 认知科学的工程映射:借鉴丹尼尔·丹尼特“多重草稿模型”,让机器人并行获得视触觉多重感知,通过优先级竞争形成“意识”焦点 技术实现与AI工程架构 * 52:58 与AI手机的竞争边界:手机是极致效率的工具,LOOI是调用AI的“角色”与“指挥者” * 55:00 模型策略:重上下文而非基座模型:核心壁垒不在于训练基座模型,而在于上下文工程与角色人设的回复策略构建 * 57:32 “双脑”架构:大模型决策+仿生反射系统 ·大模型(大脑):处理抽象后的语义信息,进行高层决策。 ·仿生行为系统(小脑/神经):基于规则与状态机,处理实时性要求高的动态反馈(如人脸跟随、避障),无需模型实时介入 4 |🅰️关于我们 Alphaist:一家生于2025的美元新基金,和它的十年赌局 如果你喜欢The Alphaist的播客内容,希望参与我们整个探索和创作过程,欢迎加入我们:加入我们|品牌内容负责人/实习生招聘中 微信公众号:Alphaist Partners 5 |📢 招贤纳士 可触未来致力于打破虚构与现实的边界,创造真实世界中的科幻角色。对LOOI技术研发、市场增长、设计创意感兴趣的小伙伴欢迎投递简历发至:hr@futureform.tech📩 邮件标题请备注:姓名+岗位
EP01 人形之外:被低估的移动机器人1|📒The Alphaist 播客栏目介绍 《The Alphaist》 是一档由Alphaist Partners打造的深度对话栏目。 我们关注技术与创业的第一性原理,聚焦那些正在改变世界的早期创始人、工程师与产品探索者。 每期节目,我们会围绕一个具体的科技创业方向展开深度对话。在这里,我们不追热点、不讲空洞概念,而是用最真实的一线经验去回答创业者最关心的问题:什么值得做?为什么是现在?我们应该怎样做? The Alphaist 相信:时代真正的机会,往往藏在那些不喧嚣、但正在被新技术、新需求、新产品悄然改变的新生领域。 我们希望用这档节目,陪伴新一代的 Alpha 创业者们,记录与见证那些改变世界的勇敢开始。 2|🤖本期播客介绍 如果你今天是一位机器人创业者, 你可能已经被“巨头”、“融资额”、“人形机器人”等等词汇淹没。 但真正的问题是:什么是我们能做、该做、值得做的? 当大众聚焦人形机器人时,我们看到对于年轻创业者来说真正的突破或许在另一条路径——移动机器人。 在算法成熟、供应链降本、用户认知提升的交汇点上,它可能不会立刻改变世界,但极可能成为未来的第一块基石。 在这一期,我们邀请了三位长期深耕机器人与智能硬件的嘉宾: * 来自大疆、有多年量产经验的算法工程师——孔阳 * 把「用户调研」作为核心方法论,帮助创业者降低试错成本的用研专家——高磊 * 把十年硬件经验与体育行业结合、希望重新定义网球发球机的机器人创业者——Sophie 我们将一起讨论: * 为什么移动机器人是年轻创业者获得成长加速度和通向具身智能的基石? * 供应链、算力与感知技术,在今天发生了哪些决定性的变化? * 为什么网球机器人突然在一年内爆发:硬件变便宜、算法变聪明、人才变充足——这些变化意味着什么? * 一个机器人产品真正的 PMF 到底如何判断? 这期节目不仅是 The Alphaist 播客的第一次亮相,也是一次关于 「技术、产品与真实用户」的深度探索。 3|🕙时间轴 00:57 节目及嘉宾介绍 03:30 为什么不做人形机器人:年轻创业者的最佳赛道选择 07:30 技术拐点已至:供应链成熟与AI算法的突破 13:17 十年后的移动机器人:通往具身智能的里程碑 17:30 哪些方向值得创业: 体育、出行、辅助生活场景机会 19:06 深度案例:🎾网球机器人创业全解析 30:51 如何构建长期壁垒:打造生活方式品牌而非硬件公司 35:52 用户调研的正确姿势:最前置的销售行为 50:00 Sophie的调研实战:调研"知道但没买"的用户 54:00 如何验证产品需求:Landing Page与低成本测试 56:28 扫地机经验教训:用户介入率是核心指标 61:16 创业何时坚持、何时转向的思考 66:18 节目使命:连结创业者、减少试错 4|📢线下活动报名 欢迎关注移动机器人行业发展的创业者、工程师、产品探索者朋友们报名参加 Alphaist Builder Mixer 线下活动,期待深圳相见: ⚡️关于我们 Alphaist:一家生于2025的美元新基金,和它的十年赌局 微信公众号:Alphaist Partners