
Vol07 为什么没有“新的好歌”了?国内外AI音乐大模型的差距在哪?本期嘉宾:姜涛,自由量级CTO兼执行CEO,哈工大博士,20年音频算法研发经验,快手早期员工,先后曾在腾讯音乐、昆仑万维组建了国内领先的音乐算法团队 每天有超过10万首新歌诞生,调用一个API就能产出QQ音乐或者Spotify上一样的音乐,但我们却在反复听周杰伦、孙燕姿的老歌。 这中间的落差,到底是什么?这期《AI深度进化》,我们和自由量级CTO兼执行CEO姜涛聊了聊: * AI音乐到底走到了哪一步? * 国内外音乐大模型有什么差异? * 当写歌变得像发朋友圈一样简单,音乐素养还意味着什么? 欢迎收听,也欢迎在评论区说说你的看法。 * 00:00 - 01:34 2026是AI音乐跃迁元年? 华纳推出人工智能歌手 七八成音乐人开始使用AI创作 * 01:35 - 06:31大厂离职创业 快手早期员工、人人都能创作的理念 2023年押注中文音乐大模型 * 06:32 - 10:33数据规模与能力跃迁 大模型瞬间的智力涌现,对AI产生信仰 * 10:34 - 15:49跨学科团队优势 团队约三十人规模 算法与音乐交叉人才非常稀少 * 15:50 - 21:58中外音乐大模型的差异 中文更注重人声表达和歌词 国外看中工具价值、国内强调情绪价值 * 21:59 - 28:45用户破圈与创作降门槛 普通人几周即可完成作品 中老年用户也开始写歌 * 28:46 - 34:25自研技术与数据壁垒 自研 Tokenizer 优化表达效果 用户数据与内容创作才是护城河 * 34:26 - 37:46审美对齐与人机分工 AI音乐的图灵测试已经完成 审美判断仍由人类完成 * 37:47 - 45:21行业冲击与个体崛起 传统音乐人打不过就加入 零基础用户也可能年入百万 * 45:22 - 55:30产品迭代与创作者升级 一句话写歌到一张图写歌 平台扶持AI音乐创作者 * 55:31 - 01:25:00闭源开源与全球竞争 闭源保障商业质量 开源促进技术生态 * 01:25:01 - 01:46:33 一人团队与多面手时代 独立创作者的黄金时代 音乐人的定义发生改变
Vol06:AI能缓解养老焦虑吗?黄石真实的社区养老场景观察这一期《AI深度进化》,我们把麦克风架在湖北黄石一间社区养老院,聊一件谁都逃不开的事:怎么养老,谁来养老。 一边是3.1 亿老人、30 年老龄化长跑,一边是AI大模型爆发、“死了吗”App 刷屏。 学财务出身、18 年就 all in AI 创业的鲁晓丹,看准了这个百亿级赛道,试图用 AI 给独居妈妈和更多老人构建一套“一呼百应”的系统。 AI 究竟能不能缓解我们的养老焦虑?理想和现实的距离还有多远?这次,我们希望带大家了解真实的AI养老落地现状。 本期节目,我们和晓丹总一起聊聊: * 养老焦虑,真的能靠 AI 治愈吗? * 当父母老去,AI 是监控还是守护? * 数字人真的能帮我们找回那个“已经不在”的亲人吗? * 变老这件事,能不能更体面、更有尊严一点? * 00:42 – 01:33|财务出身却All in AI的创业者 AI养老靠谱吗?能治好我们的焦虑吗? * 01:33 – 04:37|从AI中台到养老,为什么要“选行业深耕” 从技术至上转向价值追求,有用的才是好技术 * 04:37 – 06:17|第一次被AI击中:黑客帝国既视感 * 06:17 – 09:07|大模型爆发:天降良机?还是更残酷的淘汰赛 一度忙到每周10场售前,但真正落地场景并不多 * 09:07 – 12:03|养老其实在解决“子女的痛点” 妈妈独居、住院自己扛、联系不上就慌到想撬锁 * 12:03 – 13:31|30年老龄化进程,不是一上来就养老院 初老阶段更需要“长期在线的轻照护 + 紧急响应” * 13:31 – 18:04|居家养老“一呼百应”怎么运作 用一个智能硬件入口,通过语音喊话触发响应:点餐、上门助洁、紧急救助等 * 18:04 – 20:36|从乙方到自己下场:边界感消失,需求来自生活 做解决方案时只对合同负责;做养老后,一切需求都要自己识别 * 20:36 – 25:16|90%老人想居家,但供给最难规模化 需求端:90%居家、7%社区、3%机构;行业低毛利,靠政策兜底难以长久 * 25:16 – 30:04|技术立身,生态共建 用户端:更亲民的智能设备 + 安全/健康监测。 服务端:招募各地伙伴入驻平台(食堂/家政/上门服务等) * 30:04 – 31:23|最好的AI:让人“不用学”,用着就行 技术要内化到业务流程中,只让用户用体验说话 * 31:23 – 33:21|谁来买单:老人?子女?机构? 硬件与用户侧服务主要由用户/子女买单; * 供给侧工具由合作机构按价值付费(平台服务费/结果付费等)。 * 33:21 – 38:52|不是做产品难,是做长期服务难 自研Demo可以做,但真正难的是规模化后的系统升级、7×24保障、售后团队。百度在养老Agent、医疗服务包、远程救护机制、社区运营系统等方面更成熟,并开放二开权限 * 38:52 – 41:42|应用端才是壁垒:大模型时代唯一机会 如何在具体行业里把技术变成效率、变成体验、变成可持续运营。 * 41:42 – 46:48|养老场景的难点:成本、生态、供应链与“乱消费” 硬件成本仍需下降;生态需要足够强大才能“一呼百应”;还要建立更健康的供应链,避免老人被私域直播等误导。 * 49:12 – 51:53|数字人等AI技术会让老人沉迷吗? “到了晚年,难道不是越愉快越好吗?” AI也是子女助手:健康异常提醒、节日生日提醒等 * 51:53 – 55:58|扩张与盈利:不赚快钱,但赌三五年 政策推动(长护险/补贴消费券)方案成熟(标准化、粘性、供应链更健康) * 55:58 – 58:52|下沉市场与未来图景 下沉市场留守老人需求更旺;未来关键是让供给侧与需求侧真正匹配 * 58:52 – 01:01:28|给AI创业者的一句话建议 选准赛道,坚持长期主义。 * 01:01:28 – 01:08:25|关于“独居”与“家里有动静” * 01:08:25 – 01:10:25|终章:AI让孤单变轻,让照护更有尊严 不一定更聪明,但要更像家人,AI通过自然语言交互与Agent调度,让陪伴与便捷成为可能。
Vol05:工业场景最缺哪些AI人才?对话阿尔特汽车副总裁刘亚彬F1 赛车里动辄几十万一轮的风洞实验,他正尝试让 AI 来分担。 本期嘉宾刘亚彬,是亚洲最大独立汽车设计公司阿尔特的副总裁。 做了十几年整车研发,带着 3000 多人的工程师团队,一路服务过中国几乎所有主流车企——典型的“造车老兵”。但在这两年,他给自己加了一个新身份:在传统工业里“带队搞 AI 的新人”。 当汽车工业要的,是可信、可追溯、因果关系讲得清,而 AI 天生“不懂物理、不懂责任、还爱幻觉”,他要解决的问题就变成了:几何、物理场泛化,这些老师傅“看一眼就知道”的经验,怎样拆成机器能读懂的规则? 这一期,我们不只聊技术,还要聊一个人的转身: “只有工业的人觉醒了,才能做AI” 这期节目,我们和亚彬总一起聊聊: * 为什么汽车AI落地,比ChatGPT写文案难100倍? * 传统工程师如何靠AI变身“超级个体”? * AI时代对个人最大的挑战是什么? * 三年后,我们能靠一句话定制一辆车吗? 00:00 - 06:00 开场与国内汽车市场 * 从仿真工程师到AI业务负责人 * 阿尔特:亚洲最大的独立汽车设计公司 * 中国作为全球最好的需求验证场 * 汽车设计周期:从需求到上市的完整流程 06:00 - 10:15 汽车设计的复杂性与挑战 * 一辆车的制造有多难?从调研到量产的漫长过程 * 设计最难的点:让用户接受+保证可靠性 * 开发周期从38个月压缩到20多个月的压力 * 日以继夜加班才能实现的极限速度 10:15 - 18:30 AI落地汽车工业的难点 * 工业要求可信、科学、落地,AI初期都不具备 * 为什么要自研模型而不用Midjourney? * AI是锦上添花还是必需品? * 通过培养"超级个体"推进AI落地 * 分享AI落地的失败案例和教训 18:30 - 25:10 工业数据的困境与突破 * 工业数据的三大问题:孤岛化、工具割裂、机器难理解 * 数据治理经验:embedding和数学表达 * 工业AI最缺什么人才? * AI人才与汽车人才的融合现状 25:10 - 32:40 与百度伐谋的合作实践 * 为什么选择与伐谋合作? * 汽车设计中的"最优解"寻优过程 * 今天的最优解,明天可能就不是了 * 算法开发时间从3个月缩短到1.5个月 * 5个人的工作变成1个人就能完成 32:40 - 40:10 风阻预测的突破与价值 * 伐谋在风阻预测中的具体应用 * AI模拟精度从95%提升到97.5% * 计算时间从10小时降到几分钟 * 突破关键:算法优化而非数据堆积 * "数据本身也有护城河" 40:10 - 48:30 人才转型与组织变革 * AI改变了风阻工程师的工作内容 * 对领导力的新挑战:平衡机器和人的结果 * 老师傅的价值更加凸显 * AI在汽车工业还处于刚起步阶段 * "AI对我的挑战就是休息不够了" 48:30 - 57:00 工业AI的本质与边界 * 工业作为世界模型的理想实验场 * 工业AI vs 通用AI:更原子化、更重视规则 * "万物皆可embedding,但要知道该怎么embedding" * 能生成智能体的智能体 * 算法工程师的巨大人才缺口 57:00 - 1:06:40 供应链重构与标准制定 * AI可能重构汽车供应链的协同方式 * 阿尔特的核心优势:数据+理解力+第三方定位 * 三年后汽车设计会变成什么样? * 在新能源车标准制定上的位置转换 * 给工业AI企业的建议:面向数据、不要图快 1:06:40 - 1:13:57 未来展望与总结 * 未来人才需要交叉能力和快速适应变化 * 工业AI不存在泡沫,因为都要算ROI * 终极愿景:从B端到C端的个性化定制 * "不能像AI公司一样焦虑,给AI一点时间"
Vol04【对话】Way to AGI发起人AJ:组织形态决定了AI Native"我觉得这个班再上不了了"——这可能是大家每天内心的咆哮。 而在Way to AGI这个全球最大的AI开源社区,很多人把这句话付诸了行动。 两年前发了个朋友圈,一个月100万浏览。两年后的今天,这个文档长成了900万人的AI开源社区。 这不是什么营销神话,就是「通往AGI之路」发起人AJ的真实故事。 社区里有人月入万刀搞出海,有产品经理辞职做"街溜子",还有人批量起号搞"邪修" 虽然项目不一定都能成功孵化,但每个人都在疯狂生长。 这期节目,我们和这位ENFP高精力人群代表聊了聊: * 为什么AI时代的产品经理可以"不会写代码"? * 组织形态如何决定你能不能成为AI native? * 信息差还能吃多久?普通人的机会在哪里? * 900万人的社区为什么拒绝了几百万的投资? AI时代的焦虑怎么破?AJ的答案很简单:别焦虑,动手做。多跟AI聊天,多输出,自己找回掌控感。 00:00 - 03:30 开场:从一条朋友圈到900万人社区 * AJ的快问快答:ENFP、做一件很酷的事情 * 为什么在大厂还能保持好奇心不被磨平? 03:30 - 08:45 那根压倒骆驼的稻草 * OpenAI 12天发布会,每天4小时睡眠 * 决定辞职的瞬间:"这个班再上不了了" * AI时代的就业规则变了 08:45 - 15:20 社区里的"街溜子"们 * 高中生月入万刀搞出海 * 什么是松弛感的代表人物? * 从E人到e人:被AI时代逼着社交 15:20 - 22:10 900万人如何共建一个文档? * 众测团:可编辑文档的魔力 * "像去奶奶家鸡窝捡蛋一样惊喜" * 为什么这个社区只能在AI时代长出来? 22:10 - 28:30 AI工作流大揭秘 * 一天录音8小时,全部丢给AI * 桌面上至少三个屏幕是标配 * ChatGPT、Claude、Gemini来回切换 28:30 - 35:45 AI时代的焦虑与机会 * 每个人都可以有自己的产品 * OPC(一人公司)不是真的一个人 * 上百个项目,活下来的寥寥无几 35:45 - 42:20 网络垃圾与内容污染 * AI生成的猫猫狗狗占领YouTube * "不要让孩子干这些"梗的背后 * 平台治理vs用户自律 42:20 - 50:15 AI产业落地的真相 * 企业老板的两种极端:消极vs激进 * 为什么AI落地是老板思维、"一把手工程"? * 先别急着全流程自动化,从小环节开始 50:15 - 58:40 什么是AI native人才? * 组织形态决定人才形态 * 产品经理在AI时代的优势 * Context(上下文)比Prompt更重要 58:40 - 01:06:30 回到书里找安全感 * AI知道太多,人类还能干什么? * 李继刚的象限图:AI知道/不知道 * 多输出,多跟AI对话 01:06:30 - 01:14:20 社区的商业克制 * 拒绝了几百万的投资 * 不是利益驱动,是初心驱动 * 核心资产是"人" 01:14:20 - 01:22:15 AI圈的情绪曲线 * 23年:兴奋,每天消息999+ * 24年:迷茫,"只有卖课的赚钱了" * 25年:务实,OPC元年 01:22:15 - 未来 一年后AI圈会怎样? * 明年2月社区有大动作 * 如果有一天社区不再生长... * 终极愿景:变成旅行团🏖️
Vol03【对话】格灵深瞳CEO吴一洲:AI产业B端落地的真相这可能是最实在的一期AI访谈,没有吹牛,只有真实困境和务实经验。 从2013年创立,到2022年成为科创板AI第一股,十年间,跌宕起伏,格灵深瞳这家公司,沉淀下来了AI行业,最真实的ToB逻辑。 在本期播客里,你会听到: * 一家AI创业公司,如何从技术理想主义,转向商业务实主义 * 如果只用别人的大模型,那就不是AI公司,而是IT公司 * AI产业落地,只有20%-30%,但决心已经有80%-90% * B端客户真正需要的不是最前沿的技术,而是恰到好处 * AI产业的泡沫什么时候会破?谁能活下来? * 给AI创业者的建议:除了坚持,还需要什么?
Vol02【对话】百度秒哒业务负责人,Vibe Coding会是AI时代普通人的最大机会吗?聊AI聊创业,但也聊人类聊未来,本期AI深度进化,我们不仅关心AI进化,也关心AI时代的人该如何“进化”。 2025年,硅谷裁员潮不断,AI让程序员失业的讨论不断;与此同时,OpenAI联合创始人卡帕西提出的"Vibe coding"概念引爆全球,给Coding这个无聊的词汇加上了Z世代最火的“Vibe”前缀,会让充满西三旗牛马气息的程序员化身Hot Nerd吗?Vibe Coding到底是编程革命,还是幻觉和焦虑催生的行业狂欢? 我们请到了清华大学博士、百度无代码工具秒哒MeDo的负责人朱广翔,听听他是怎么说的。 在本期节目里,你将听到: * 一个从初中写代码写到博士的人,为什么不想再写了? * 多智能体如何像人类团队一样"相爱相杀"? * 从玩具到生产力工具,vibe coding跨过那道门槛了吗? * 当AI能省掉70%的工作,程序员的未来会是什么样? * 在Vibe coding这场全球竞速里,中国的机会在哪里? * 在技术变革中,是人去适应AI,还是AI来适应人?
Vol.01科技巨头们扎堆的AI眼镜赛道,中国创业者怎么闯出自己的蓝海?Hello欢迎收听《AI深度进化》,这是一档关注AI技术发展、产业落地的播客栏目。如果你对:"AI能用来干什么?"这个问题的答案还停留在Chatbot和图像生成,那你可能错过了AI最“野”的一面。 我们将带大家走进AI实验室、创业公司、研发一线,记录AI在产业落地过程中的突破、挣扎与灵光。 这期节目我们要聊的就是当下的大热赛道——AI眼镜。眼镜这个单品,经历过Google glass 、Vision pro、Meta轮番实验,一直处在略显尴尬的境地。但这两年随着大语言模型的发展,它似乎真的迎来了自己的Timing。 今天,我们请来了一位非常懂“爆款”的嘉宾——他是李未可科技的创始人、CEO茹忆,也是当年小米电视、天猫精灵两大爆品的产品负责人。现在打造了李未可智能眼镜这款明星产品。 在今天这期节目里,你会听到: 1.为什么巨头们都没做成的AI眼镜,现在有机会了? 2.一副真正有用的AI眼镜,到底应该解决什么问题? 3.中国创业者如何在"红海"里造出"航空母舰"? 4.科技平权和爆品思维,在AI时代意味着什么? 对了,新号营业,我们也准备了一些小福利: 听到最后的粉丝们,去评论区留言互动,就可以参与抽奖,我们将在评论区选出5位听众送出爱奇艺黄金年卡会员!