AI 漫谈

34已订阅

AI 漫谈

KrystalN0Shy

单集更新

节目详情

25.灵光：让 AI 不止会聊，还会“造工具”
本期让我们一起深入了解蚂蚁集团新出的全模态 AI——灵光。它能用一句话帮你做出可交互的小应用，还能识别现实世界、生成 3D、图像和动画。通过多个真实例子，带你快速理解灵光与其他 AI 的不同：它不只回答你问题，而且帮你做工具。举个例子🌰： 1️⃣全模态：结构化回答+可视化展示 2️⃣灵光闪应用 3️⃣灵光‘开眼’
9分钟 · 5个月前
13
1
24.Marble：让 AI 创造自己的 3D 世界
本期节目我们继续从具身智能出发，深入另一条同样重要的路径：空间智能与世界模型。聊聊李飞飞团队World Labs推出的 Marble ——一个能用文字、图片甚至视频生成完整 3D 世界的平台。 Marble 不只是“做 3D 场景”，它让 AI 开始学会“理解世界、构建世界”，为机器人训练、数字孪生、游戏生成、VR 创作打开新的大门。讨论内容： * 02:42 为什么 AI 需要“自己的虚拟世界”？ * 04:59 Marble核心功能 * 06:35 Marble 和 UnrealZoo 有什么本质区别？ * 08:22 生成式世界模型会如何改变未来机器人？轻松但深入，知识密度刚刚好。如果你对 AI 的下一个阶段好奇，这一期你一定会喜欢。
10分钟 · 5个月前
6
0
23.UnrealZoo：AI 的虚拟地球
你有没有想过，AI 不只是“会思考”，还能在虚拟世界里动手、动脚、动脑？本期节目，我们带你走进 UnrealZoo——一个基于 Unreal Engine 的高清、可交互、专为具身智能研究打造的虚拟世界集合。我们将从最基础的概念——什么是具身智能——讲起，逐步探索 UnrealZoo 的设计动机、核心功能和实际应用，揭示 AI 如何在虚拟世界中训练、学习和试错，甚至为未来更加真实的机器人铺路。 🔹 主要内容： * 00:37 具身智能与 AI 行为的关系 * 01:28 UnrealZoo 的虚拟世界库与可控实体 * 04:06 AI 如何通过模拟环境进行强化学习和世界模型训练 * 05:14 实验发现、挑战与未来发展官方网站：http://unrealzoo.site/ 代码库 GitHub：https://github.com/UnrealZoo/unrealzoo-gym?utm_source=chatgpt.com
8分钟 · 5个月前
3
0
22.Google Stitch实测：UI设计效率提升10倍？
没有设计基础，也能做出专业原型？这次让我们深度体验Google全新AI设计工具Stitch，直接用一句话生成电商站、音乐App界面，还能导入Figma继续优化。本期分享真实测试、优缺点与使用技巧，让开发者和创业者都能用AI快速搭建产品原型！电商网站：音乐播放器App：
9分钟 · 6个月前
9
0
21.Pomelli：Google 的 AI 营销新棋局
Google 推出 AI 营销实验工具 Pomelli，看似平淡，实则隐藏广告生态战略。本期节目解析它如何训练 AI 理解品牌、生成广告素材，并探讨未来营销的变化趋势。
9分钟 · 6个月前
2
0
20.Deepseek-OCR：破大模型长文本困局的新思路
大模型的 “信息过载” 难题，或许能从生物记忆里找答案 —— 人类会随时间精简记忆，只留核心轮廓，Deepseek-OCR 正借鉴这一逻辑：对信息做动态视觉压缩，1/10 Token 压缩规模下有 96.5% 理解高准率。更关键的是，它跳出传统一维文本局限，用视觉处理破解算力上限，这会是大模型迭代的新方向吗？
6分钟 · 6个月前
4
0
19.AI 浏览器：Atlas 刚上线，Comet 和 Dia 还香吗？
本期聚焦 OpenAI 新发布的 AI 原生浏览器 ChatGPT Atlas，解析其自动化任务处理、多模态交互等核心能力，同时对比 Comet 的专业研究属性与 Dia 的隐私保护优势。从功能适配到场景需求，为你梳理 AI 浏览器的选择逻辑 —— 想精准匹配工具？听这期就够了。
10分钟 · 6个月前
2
0
18.脑机接口的下一场革命：Merge Labs 与未来的人机融合
想了解不用开颅的脑机接口？本期节目我们来聊聊 Merge Labs—— 由 OpenAI CEO Sam Altman 发起，和 Neuralink 走了条完全不同的路。它靠 “声遗传学” 技术，先让特定神经元 “听懂” 超声波，再用外部小设备传递信号，相当于给大脑装 “蓝牙”。未来或许能帮瘫痪者用意念控机械臂，帮盲人重获部分视觉，但现在它还停在实验室阶段，没公布过实验结果。它离真正落地还有多远？和 Neuralink 的路径又有何不同？节目里会慢慢说清。
9分钟 · 6个月前
1
0
17.Lovart：AI设计智能体重塑创意生产力
Lovart 是由 Liblib AI 于 2025 年推出的全球首个专业设计智能体，以“AI与人类协作的创作空间”为核心理念，正在重塑创意生产力格局。它整合了 Gemini、OpenAI、Luma AI、Sora 2 等顶尖多模态模型，能够在统一画布中完成从图像、视频到文本排版的全流程创作，实现真正的跨媒介协同与自动化设计。此外，Lovart 推出了国内版 “星流 Agent”，针对中文语义与国风审美进行了深度优化，更好地适配东方设计语境与本土使用场景。本期节目将带你了解这款AI设计智能体如何以全流程自动化与多模态整合，重新定义创意行业的生产力边界。 Lovart 并不做模型本身，而是把主流的图片、视频、3D 生成模型都整合到了一个画布里。现在市面上的模型越来越多，各有各的特长。而模型之上的交互设计，在当下仍然是被低估的。好的交互是能把复杂的流程变得简单、易用。并且多模型的无缝整合，也能为用户节省 Context 的切换。做好这两点，本身就是壁垒。
8分钟 · 6个月前
14
0
16.ACP协议登场：AI电商“边聊边买”时代来临
OpenAI 与 Stripe 联手推出 ACP 协议（Agentic Commerce Protocol），让 AI 真正具备“边聊边买”的能力——用户在聊天中即可完成从发现商品到支付结账的全过程。这一协议是 ChatGPT 实现 “Buy it in ChatGPT” 的底层技术，代表了智能电商的全新形态：无需跳转网页、无需输入支付信息，AI 就能帮你下单、付款、通知商家发货，实现真正的“无缝交易”。本期节目将带你深入解析 ACP 的核心理念、即时结账机制。同时讨论 ACP 对用户体验、商家接入和未来 AI 经济生态的深远影响——当购物像聊天一样自然，电商的下一步，会是什么？
8分钟 · 6个月前
2
0
15.新工具Calicat：一句话生原型+任务管理
Calicat 首版上线并免费开放，一句话即可生成原型，需求、任务与协作深度打通。虽仍有交互生成与稳定性不足，但对小团队和产品人而言，是一款值得尝试的新工具。
9分钟 · 7个月前
5
0
14.手机秒变导游：飞猪AI讲解上线
飞猪上线“拍文物听讲解”，覆盖全球676个景点和博物馆，支持离线使用，并贴心设计提醒和优化体验。拍照即可获专业解说与互动体验，带来全新的文旅玩法。国庆假期即将到来，感兴趣的朋友快去体验吧！
9分钟 · 7个月前
1
0
13.Notion 3.0：重构效率的新引擎
Notion 3.0 发布，迎来最大版本迭代。全新 AI Agent 不仅能自主完成页面管理、数据库操作，还能跨平台获取信息，生成结构化内容。它具备记忆与学习能力，逐渐适应个人偏好；同时支持团队协作与自动化流程，让信息管理与执行更高效。本期播客，我们将带你快速了解 Notion 3.0 的核心亮点与未来潜力。
10分钟 · 7个月前
5
0
12.AP2协议：AI 双向协商如何重构智能支付场景？
谷歌云正式发布智能体支付协议AP2(Agent Payments Protocol)，旨在为自主人工智能智能体发起的安全支付建立全球标准。 AP2不是新付款APP，而是一套AI交易规则，能解决抢票手慢、续费漏关、跨境支付换软件等问题。你给支付AI设“加密授权书”，明确买啥、花多少钱、有效期，它就会主动对接商家AI。支付AI亮需求、商家AI核条件，符合要求就自动付款，还能自主决策（拒超预算项）、议价（帮砍价），跨平台不用重复设规则。怕不安全？授权与记录加密可追溯；怕买错？随时撤授权，退款有证据。它是帮你省心的花钱助手，目前支持的商家在逐步增加。 AP2与传统支付的本质区别：
8分钟 · 7个月前
3
0
11.解锁 MidooAI：个性化学习的未来已来
本期播客聚焦最新创新学习Agent--MidooAI。深入拆解其四大核心功能：以 “骨架 + 血肉” 混合模式生成个性化学习路径；用严谨知识图谱保障学习系统性；打造沉浸式场景模拟、动态适配课程；更构建了超懂你的学习搭子--共情式伙伴关系。所以，为什么说 MidooAI 是 “学习 agent”，和以前的学习Tool相比，到底强在哪儿？快来听听看吧！
10分钟 · 7个月前
2
0

与AI数字人一起，漫谈AI天下事一档人类与AI协作的前沿资讯节目。我们坚持「人类精心编撰，AI倾情献声」——旨在提供值得信赖的最新AI动态。在这里，你的数字主播将以独特的科技视角，漫谈最前沿的科技新闻，让我们一起洞察未来。