

25.灵光:让 AI 不止会聊,还会“造工具”本期让我们一起深入了解蚂蚁集团新出的全模态 AI——灵光。 它能用一句话帮你做出可交互的小应用,还能识别现实世界、生成 3D、图像和动画。 通过多个真实例子,带你快速理解灵光与其他 AI 的不同: 它不只回答你问题,而且帮你做工具。 举个例子🌰: 1️⃣全模态:结构化回答+可视化展示 2️⃣灵光闪应用 3️⃣灵光‘开眼’
24.Marble:让 AI 创造自己的 3D 世界本期节目我们继续从具身智能出发,深入另一条同样重要的路径:空间智能与世界模型。 聊聊李飞飞团队World Labs推出的 Marble ——一个能用文字、图片甚至视频生成完整 3D 世界的平台。 Marble 不只是“做 3D 场景”,它让 AI 开始学会“理解世界、构建世界”,为机器人训练、数字孪生、游戏生成、VR 创作打开新的大门。 讨论内容: * 02:42 为什么 AI 需要“自己的虚拟世界”? * 04:59 Marble核心功能 * 06:35 Marble 和 UnrealZoo 有什么本质区别? * 08:22 生成式世界模型会如何改变未来机器人? 轻松但深入,知识密度刚刚好。 如果你对 AI 的下一个阶段好奇,这一期你一定会喜欢。
23.UnrealZoo:AI 的虚拟地球你有没有想过,AI 不只是“会思考”,还能在虚拟世界里动手、动脚、动脑?本期节目,我们带你走进 UnrealZoo——一个基于 Unreal Engine 的高清、可交互、专为具身智能研究打造的虚拟世界集合。 我们将从最基础的概念——什么是具身智能——讲起,逐步探索 UnrealZoo 的设计动机、核心功能和实际应用,揭示 AI 如何在虚拟世界中训练、学习和试错,甚至为未来更加真实的机器人铺路。 🔹 主要内容: * 00:37 具身智能与 AI 行为的关系 * 01:28 UnrealZoo 的虚拟世界库与可控实体 * 04:06 AI 如何通过模拟环境进行强化学习和世界模型训练 * 05:14 实验发现、挑战与未来发展 官方网站:http://unrealzoo.site/ 代码库 GitHub:https://github.com/UnrealZoo/unrealzoo-gym?utm_source=chatgpt.com
22.Google Stitch实测:UI设计效率提升10倍?没有设计基础,也能做出专业原型?这次让我们深度体验Google全新AI设计工具Stitch,直接用一句话生成电商站、音乐App界面,还能导入Figma继续优化。本期分享真实测试、优缺点与使用技巧,让开发者和创业者都能用AI快速搭建产品原型! 电商网站: 音乐播放器App:
21.Pomelli:Google 的 AI 营销新棋局Google 推出 AI 营销实验工具 Pomelli,看似平淡,实则隐藏广告生态战略。 本期节目解析它如何训练 AI 理解品牌、生成广告素材,并探讨未来营销的变化趋势。
20.Deepseek-OCR:破大模型长文本困局的新思路大模型的 “信息过载” 难题,或许能从生物记忆里找答案 —— 人类会随时间精简记忆,只留核心轮廓,Deepseek-OCR 正借鉴这一逻辑:对信息做动态视觉压缩,1/10 Token 压缩规模下有 96.5% 理解高准率。更关键的是,它跳出传统一维文本局限,用视觉处理破解算力上限,这会是大模型迭代的新方向吗?
19.AI 浏览器:Atlas 刚上线,Comet 和 Dia 还香吗?本期聚焦 OpenAI 新发布的 AI 原生浏览器 ChatGPT Atlas,解析其自动化任务处理、多模态交互等核心能力,同时对比 Comet 的专业研究属性与 Dia 的隐私保护优势。从功能适配到场景需求,为你梳理 AI 浏览器的选择逻辑 —— 想精准匹配工具?听这期就够了。
18.脑机接口的下一场革命:Merge Labs 与未来的人机融合想了解不用开颅的脑机接口?本期节目我们来聊聊 Merge Labs—— 由 OpenAI CEO Sam Altman 发起,和 Neuralink 走了条完全不同的路。 它靠 “声遗传学” 技术,先让特定神经元 “听懂” 超声波,再用外部小设备传递信号,相当于给大脑装 “蓝牙”。未来或许能帮瘫痪者用意念控机械臂,帮盲人重获部分视觉,但现在它还停在实验室阶段,没公布过实验结果。 它离真正落地还有多远?和 Neuralink 的路径又有何不同?节目里会慢慢说清。
17.Lovart:AI设计智能体重塑创意生产力Lovart 是由 Liblib AI 于 2025 年推出的全球首个专业设计智能体,以“AI与人类协作的创作空间”为核心理念,正在重塑创意生产力格局。 它整合了 Gemini、OpenAI、Luma AI、Sora 2 等顶尖多模态模型,能够在统一画布中完成从图像、视频到文本排版的全流程创作,实现真正的跨媒介协同与自动化设计。 此外,Lovart 推出了国内版 “星流 Agent”,针对中文语义与国风审美进行了深度优化,更好地适配东方设计语境与本土使用场景。 本期节目将带你了解这款AI设计智能体如何以全流程自动化与多模态整合,重新定义创意行业的生产力边界。 Lovart 并不做模型本身,而是把主流的图片、视频、3D 生成模型都整合到了一个画布里。 现在市面上的模型越来越多,各有各的特长。而模型之上的交互设计,在当下仍然是被低估的。好的交互是能把复杂的流程变得简单、易用。并且多模型的无缝整合,也能为用户节省 Context 的切换。做好这两点,本身就是壁垒。
16.ACP协议登场:AI电商“边聊边买”时代来临OpenAI 与 Stripe 联手推出 ACP 协议(Agentic Commerce Protocol),让 AI 真正具备“边聊边买”的能力——用户在聊天中即可完成从发现商品到支付结账的全过程。 这一协议是 ChatGPT 实现 “Buy it in ChatGPT” 的底层技术,代表了智能电商的全新形态:无需跳转网页、无需输入支付信息,AI 就能帮你下单、付款、通知商家发货,实现真正的“无缝交易”。 本期节目将带你深入解析 ACP 的核心理念、即时结账机制。同时讨论 ACP 对用户体验、商家接入和未来 AI 经济生态的深远影响——当购物像聊天一样自然,电商的下一步,会是什么?
15.新工具Calicat:一句话生原型+任务管理Calicat 首版上线并免费开放,一句话即可生成原型,需求、任务与协作深度打通。虽仍有交互生成与稳定性不足,但对小团队和产品人而言,是一款值得尝试的新工具。
14.手机秒变导游:飞猪AI讲解上线飞猪上线“拍文物听讲解”,覆盖全球676个景点和博物馆,支持离线使用,并贴心设计提醒和优化体验。拍照即可获专业解说与互动体验,带来全新的文旅玩法。国庆假期即将到来,感兴趣的朋友快去体验吧!
13.Notion 3.0:重构效率的新引擎Notion 3.0 发布,迎来最大版本迭代。全新 AI Agent 不仅能自主完成页面管理、数据库操作,还能跨平台获取信息,生成结构化内容。它具备记忆与学习能力,逐渐适应个人偏好;同时支持团队协作与自动化流程,让信息管理与执行更高效。本期播客,我们将带你快速了解 Notion 3.0 的核心亮点与未来潜力。
12.AP2协议:AI 双向协商如何重构智能支付场景?谷歌云正式发布智能体支付协议AP2(Agent Payments Protocol),旨在为自主人工智能智能体发起的安全支付建立全球标准。 AP2不是新付款APP,而是一套AI交易规则,能解决抢票手慢、续费漏关、跨境支付换软件等问题。你给支付AI设“加密授权书”,明确买啥、花多少钱、有效期,它就会主动对接商家AI。 支付AI亮需求、商家AI核条件,符合要求就自动付款,还能自主决策(拒超预算项)、议价(帮砍价),跨平台不用重复设规则。怕不安全?授权与记录加密可追溯;怕买错?随时撤授权,退款有证据。它是帮你省心的花钱助手,目前支持的商家在逐步增加。 AP2与传统支付的本质区别:
11.解锁 MidooAI:个性化学习的未来已来本期播客聚焦最新创新学习Agent--MidooAI。深入拆解其四大核心功能:以 “骨架 + 血肉” 混合模式生成个性化学习路径;用严谨知识图谱保障学习系统性;打造沉浸式场景模拟、动态适配课程;更构建了超懂你的学习搭子--共情式伙伴关系。 所以,为什么说 MidooAI 是 “学习 agent”,和以前的学习Tool相比,到底强在哪儿?快来听听看吧!