

十二个问题解剖 VLA,深度对话小米陈龙、上交穆尧2025年末,首批L3级自动驾驶车型获得准入,标志着中国智能驾驶产业迈入新纪元。与此同时,具身智能机器人领域也在过去一年间经历了“天翻地覆”的变化,从2024年初“抓苹果都费劲”,到如今叠衣服已成为行业的入门任务,穿鞋带这样曾被认为遥不可及的精细操作也已被攻克。 在这场技术跃迁的背后,一项被称为VLA(Vision-Language-Action,视觉语言动作大模型)的技术正成为连接自动驾驶与具身智能的关键枢纽。不同于传统端到端模型从视觉直接映射到动作的“条件反射”式决策,VLA将语言理解与推理能力引入物理世界的决策链路,赋予机器“看了就懂、懂了就做”的认知能力。 然而,VLA 的兴起也伴随着争议。在 2025 年世界机器人大会上,宇树科技创始人王兴兴公开质疑这一技术路线,引发行业热议。这场争论的背后,是软件与硬件、泛化性与可靠性、学术探索与商业落地之间的深层张力。 为深入探讨这一前沿技术的本质、挑战与前景,我们邀请到两位走在VLA研究最前沿的嘉宾:小米汽车智能驾驶 VLA 技术负责人陈龙,以及上海交通大学计算机学院助理教授、ScaleLab 负责人穆尧。他们分别从自动驾驶和具身智能机器人的视角,为我们拆解 VLA 的技术内核,剖析数据困境与安全挑战,并回应来自产业界的质疑。 以下是本次对话的完整内容。 时间线: 00:04-01:20 开场:VLA是通往下一代通用人工智能的关键路径 01:20-08:13 一、什么是VLA? 08:13-12:24 二、VLA与端到端自动驾驶的区别 12:24-19:00 三、什么是长尾问题和泛化问题? 19:00-24:33 四、VLA不只是加了一层语言 24:33-29:16 五、机器人对语言的要求更高 29:16-32:40 六、自动驾驶与机器人能共用一套底座模型吗? 32:40-42:18 七、数据问题:自动驾驶vs机器人 42:18-45:55 八、安全性问题:如何保证VLA不出错? 45:55-54:28 九、实时性问题:VLA的延迟怎么解决? 54:28-01:00:05 十、思考与执行可以并行 01:00:05-01:04:22 十一、世界模型与空间智能:争论还是融合? 01:04:22-01:11:18 十二、如何看待对VLA技术的质疑?
对话知存科技CEO王绍迪:存算一体如何重塑AI计算的未来当大模型时代呼啸而来,算力成为制约 AI 发展的关键瓶颈。传统的冯·诺依曼架构中,数据在存储单元和计算单元之间频繁“搬运”,不仅耗费时间,更消耗了 60% 至 90% 的无用功耗,形成了难以逾越的“存储墙”和“功耗墙”。 存算一体技术正是为破解这一困局而生。它将计算与存储融合在一起,让数据在存储单元内部就近完成计算,从根本上解决了数据搬运的问题。2024 年,随着三星与 SK 海力士推动 LPDDR6-PIM 技术标准化,以及多款存算一体 AI 芯片相继出货,这一技术正加速从实验室走向产业应用。据预测,2025 年全球存算一体芯片市场规模将突破 120 亿美元,中国占比达 30%。 在这一赛道上,知存科技是最早入局、坚持最久的玩家之一。2017 年,创始人王绍迪博士毕业后回国创业,带领团队实现了存算一体芯片的量产,产品已应用于二十多款消费电子产品。2025 年 9 月,知存科技入选《麻省理工科技评论》年度“50 家聪明公司”,他们的上榜理由是“突破传统芯片存储与计算分离的架构,在能效、计算并行度、功耗等多个维度获得显著提升”。 本期对话,我们与王绍迪博士深入探讨存算一体技术的原理与前景,从内存涨价的底层逻辑,到端侧大模型的算力困局,再到 AI 时代芯片产业的竞争格局,试图勾勒出一幅由高效算力驱动的智能未来图景。 时间线: 00:00–06:43|从“内存涨价”聊到算力瓶颈 06:43–17:30|存算一体到底是什么:把“搬数据”这件事干掉 17:30–26:39|先落地耳机:几毫瓦功耗里跑更复杂的 AI 27:10–35:00|能做主芯片吗:从 GPU 发展史讲到矩阵并行 40:20–47:13 |机器人为何必须端侧:1ms 延迟与“all in transformer”的转向 49:08–01:07:39|生态与长期主义:杀手级应用、国内外节奏、AI 泡沫与收尾
智能眼镜大爆发,我们和雷鸟创新AI负责人聊了下为什么2025年,是 AI 智能眼镜大爆发的一年。 从 Meta 的 Ray-Ban 智能眼镜在全球销量突破百万副开始,一场“百镜大战”正在全球范围内上演。在中国市场,阿里发布夸克AI眼镜、百度推出小度AI眼镜、小米第二季度推出新品、理想汽车甚至跨界发布了Livis眼镜。从互联网大厂到手机厂商,从AR创业公司到汽车制造商,所有人都在押注:眼镜将成为继手机之后,下一代人机交互的关键入口。 据IDC预测,2025年全球智能眼镜出货量将达1451.8万台,中国市场将占据290.7万台。然而,在这场狂热的竞赛中,真正的“杀手级应用”是什么?第一人称视角的数据采集意味着什么?眼镜真的能取代手机吗? 带着这些问题,我们与雷鸟创新AI方向负责人程思婕进行了一次深度对话。作为清华计算机系博士,从2019年本科时期就开始研究语言模型,从BERT到GPT,再到具身智能,她的研究轨迹恰好折射出AI领域这几年最重要的变革。而她从机器人赛道转向智能眼镜的选择,或许能为我们理解这个行业提供一个独特的视角。 00:00 - 02:37 | 开场+嘉宾自我介绍、研究方向概览 02:37 - 04:24 | 学术/实习路径与“更偏真实世界”的选择 04:24 - 09:35 | 为什么从机器人转向智能眼镜:短期瓶颈与数据逻辑 09:35 - 13:46 | 眼镜的“中间态”定位;刚需属性与国内外差异 13:46 - 20:28 | 第一人称视角:价值、眼动/噪声、数据挑战与多视角融合 20:28 - 39:09 | 用户需求与产品落地:稳定性/核心场景;硬件 trade-off;团队协作与迭代节奏 39:09 - 47:07 | 硬件公司 vs 软件公司做 AI:订阅服务趋势;眼镜与手机/AR vs VR 的未来想象 47:07 - 54:07 | 眼镜智能体该做什么;隐私安全;意图识别与脑机接口设想 54:07 - 01:01:15 | 睡眠/助手设想;AI for Good(视障/听障)与结语
英文对话Skild AI创始研究员:26岁的他想用“全具身大脑”重新定义机器人(播客为英文对话,如需收听中文,请查看节目列表,中文版内容由 AI 转录) 屏幕里,一把电锯正切向机器人的腿。 这段乍看之下像是科幻惊悚片的画面,实则是 Skild AI 今年发布的一段核心技术测试。但令人惊讶的不只是暴力的破坏场景,而是接下来的反转:那只失去了腿的四足机器人,仅仅在原地踉跄了几下,便重新找回平衡,稳步前行。它从未在训练数据中见过“半截腿”的形态,却展现出了近乎生物本能的适应力。 (来源:X) 这段视频在社交媒体上激起了不小的水花,也将这家成立不到两年的公司推向了聚光灯下。 2024 年 7 月,Skild AI 以 15 亿美元估值完成 3 亿美元 A 轮融资,投资方名单堪称硅谷“顶配”:杰夫·贝索斯、软银、Lightspeed 和红杉资本悉数在列。不到一年后的 2025 年 6 月,公司又完成由软银领投的 B 轮融资,估值飙升至约 45 亿美元,英伟达和三星等科技巨头也参与了这轮投资。 Skild AI 的创始团队主张:真正的 AGI 必须扎根于物理世界。 在匹兹堡东区的一栋办公楼里,机器人正在爬楼梯、跳跃间隙、精确抓取 AirPods 装进充电盒。控制这些形态各异机器人的,是同一个“大脑”——Skild Brain。这是一个号称能跨越任何硬件形态、执行任何物理任务的基础模型。Skild AI 声称其训练数据规模是竞争对手的 1,000 倍以上,而支撑这一切的核心技术路径,正是大规模仿真训练。 而在这支由卡内基梅隆大学(CMU)资深教授领衔的团队中,有一位年仅 26 岁的创始研究员格外突出。当 Skild AI 于 2024 年 7 月走出隐身模式时,Ananye Agarwal 在社交媒体上写道:“我们换了三次办公室,人员和机器人数量增长了 10 倍,在不到一年的时间里成为了独角兽。” 从高中物理奥赛金牌得主,到让机器狗在极限地形上“跑酷”的博士生,Ananye 的研究直接催生了 Skild AI 的核心技术。2025 年,他因在机器人和 AI 领域的突出贡献入选《麻省理工科技评论》“35 岁以下科技创新 35 人”亚太区(TR35 Asia Pacific)榜单。 美东时间凌晨 12 点半,在这位年轻研究者即将结束一天工作时,他在线上接受了我们的采访,向我们讲述了一个关于物理世界、机器人大脑和 AGI 的故事。 时间线 00:00 - 02:27 | 嘉宾介绍与开场 02:27 - 15:44 | 学术背景:从物理金牌到 AI 信仰 15:44 - 24:52 | CMU 博士生涯:盲狗与记忆网络 25:06 - 27:40 | 在 Sim-to-Real(仿真到现实)领域的关键探索 27:40 - 32:38 | 导航与极限跑酷 (Parkour) 33:03 - 38:33 | 灵巧手 (LEAP Hand) 与数据融合 38:33 - 41:53 | 算法进阶:从 BPO 到 SAPG 41:53 - 51:12 | Skild AI 的愿景:通用机器人大脑 51:12 - 01:04:42 | 数据瓶颈、视频与安全性 01:04:42 - 01:08:41 | 机器人与人类未来 01:10:01 - 01:14:06 | 给年轻人的建议与结语
对话Skild AI创始研究员:26岁的他想用“全具身大脑”重新定义机器人(原访谈为英文对话,内容由 AI 转录,如需收听英文,请查看节目列表英文版) 屏幕里,一把电锯正切向机器人的腿。 这段乍看之下像是科幻惊悚片的画面,实则是 Skild AI 今年发布的一段核心技术测试。但令人惊讶的不只是暴力的破坏场景,而是接下来的反转:那只失去了腿的四足机器人,仅仅在原地踉跄了几下,便重新找回平衡,稳步前行。它从未在训练数据中见过“半截腿”的形态,却展现出了近乎生物本能的适应力。 [图片] (来源:X) 这段视频在社交媒体上激起了不小的水花,也将这家成立不到两年的公司推向了聚光灯下。 2024 年 7 月,Skild AI 以 15 亿美元估值完成 3 亿美元 A 轮融资,投资方名单堪称硅谷“顶配”:杰夫·贝索斯、软银、Lightspeed 和红杉资本悉数在列。不到一年后的 2025 年 6 月,公司又完成由软银领投的 B 轮融资,估值飙升至约 45 亿美元,英伟达和三星等科技巨头也参与了这轮投资。 Skild AI 的创始团队主张:真正的 AGI 必须扎根于物理世界。 在匹兹堡东区的一栋办公楼里,机器人正在爬楼梯、跳跃间隙、精确抓取 AirPods 装进充电盒。控制这些形态各异机器人的,是同一个“大脑”——Skild Brain。这是一个号称能跨越任何硬件形态、执行任何物理任务的基础模型。Skild AI 声称其训练数据规模是竞争对手的 1,000 倍以上,而支撑这一切的核心技术路径,正是大规模仿真训练。 而在这支由卡内基梅隆大学(CMU)资深教授领衔的团队中,有一位年仅 26 岁的创始研究员格外突出。当 Skild AI 于 2024 年 7 月走出隐身模式时,Ananye Agarwal 在社交媒体上写道:“我们换了三次办公室,人员和机器人数量增长了 10 倍,在不到一年的时间里成为了独角兽。” 从高中物理奥赛金牌得主,到让机器狗在极限地形上“跑酷”的博士生,Ananye 的研究直接催生了 Skild AI 的核心技术。2025 年,他因在机器人和 AI 领域的突出贡献入选《麻省理工科技评论》“35 岁以下科技创新 35 人”亚太区(TR35 Asia Pacific)榜单。 美东时间凌晨 12 点半,在这位年轻研究者即将结束一天工作时,他在线上接受了我们的采访,向我们讲述了一个关于物理世界、机器人大脑和 AGI 的故事。 时间线 00:00 - 02:12 | 嘉宾介绍与开场 02:12 - 09:06 | 学术背景:从物理金牌到 AI 信仰 09:06 - 14:57 | CMU 博士生涯:盲狗与记忆网络 14:57 - 16:53 | 在 Sim-to-Real(仿真到现实)领域的关键探索 16:53 - 20:24 | 导航与极限跑酷 (Parkour) 20:24 - 23:25 | 灵巧手 (LEAP Hand) 与数据融合 23:25 - 25:35 | 算法进阶:从 BPO 到 SAPG 25:35 - 31:31 | Skild AI 的愿景:通用机器人大脑 31:31 - 40:30 | 数据瓶颈、视频与安全性 40:30 - 42:31 | 机器人与人类未来 42:40 - 45:03 | 给年轻人的建议与结语
浅谈人形机器人|对话北京通用人工智能研究院黄思远能够像人类一样行走、观察、思考并灵巧操作的机器人,它们不再是被固定在流水线上的机械臂,而是能自主踏入复杂多变的生活环境,成为真正的助手、伙伴甚至探索者。这不仅仅是技术的飞跃,更是一场关于人工智能如何“走出屏幕”、拥有“身体”并学会在物理世界中自主行动的认知革命。人形机器人与具身智能,不仅是科幻作品中的常客,更是引领未来产业变革、深刻理解智能本质的关键钥匙。 本期嘉宾 黄思远:博士,北京通用人工智能研究院(BIGAI)的研究科学家,并担任通用视觉实验室主任,通研院-宇树联合实验室主任。他在加州大学洛杉矶分校(UCLA)统计系获得博士学位,导师是朱松纯教授。他的研究旨在构建一个能够理解和与三维环境交互的类人通用智能体。为实现这一目标,他在以下方向做出了研究贡献:(1)开发可泛化的视觉表征以用于三维重建和语义落地,(2)建模并模仿人类与三维世界的复杂交互,(3)构建擅长与三维世界和人类交互的具身智能体。他的研究发表于五十余篇会议及期刊论文,并曾获得 ICML Bridge Between Perception and Reasoning Workshop 最佳论文,UCLA 优秀博士论文等奖项。他致力于开发能理解三维物理世界的具身智能体和视觉机器人。 主持人 冰冉 时间轴 08:20人形机器人何时可以走进人类社会 15:25在工业界已经有哪些应用了 18:14人形机器人与具身智能 25:58机器人在仿真环境中开展训练 28:34机器人如何建立空间智能 38:00VR/AR 上应用空间智能 47:01空间智能的数据如何获取 57:45当前人形机器人落地应用的最大技术瓶颈是什么 内容聚焦 本期播客聚焦人形机器人、具身智能的核心概念及其对社会的影响。2025 年,人形机器人技术迎来了显著进展,全球首款电机驱动人形机器人成功实现了侧空翻,在成本与技术迭代速度上展现出优势。这一发展得益于大模型、通用人工智能的推动以及硬件与算法的成熟,特别是在视觉技术、空间智能(对三维世界的理解)和端到端算法(如“聚生智能”概念)方面的突破。人形机器人因其在行走便利性和任务泛化上的潜力,被视为适应人造环境的理想形态,正逐步进入工业场景(如巡检、物流、繁重重复劳动),并展现出在家庭服务、养老辅助乃至成为个人全能助理的广阔前景。然而,其发展仍面临核心挑战:空间智能(特别是三维空间深度理解与决策)、高质量真实世界数据的稀缺(限制了模型泛化能力,尤其在处理长尾场景时)、仿真环境与现实迁移的差距(材质、光照差异)、以及寻找可行的通用生活服务应用场景。此外,传感器技术(激光雷达与双目视觉的融合、触觉传感器)、多模态数据融合、模型架构(Transformer 主导但寻求创新)、以及安全隐私、恐怖谷效应等社会伦理问题也需持续探索。尽管存在瓶颈,业界对未来 3-5 年人形机器人提升生产力、解放人类并深刻影响社会经济充满期待,其发展路径被认为更可能从特定功能逐步迭代至通用智能。 制作团队 主持人:冰冉 剪辑:嘉鱼 运营:大壮
普通人如何用好AI:从技术到应用的全方位解读大模型以其强大的语言处理能力、高效的专业任务表现以及仿佛具有“人工智能觉醒”般的特性,成功吸引了全球众多用户的关注。在应用领域,AI 已经在医疗、科研、教育、法律等多个领域展现出广泛的应用现状和巨大的潜力。对普通人来说,迎接 AI、拥抱 AI 需要准备什么?需要怎么做?本地部署还是云端部署?下一个值得关注的方向是什么?本期 DeepTalk 将从尽量落地的角度,聊一聊人工智能正在如何改变我们的生活和工作,作为普通人的我们如何更好地使用 AI,帮助生活、工作更加高效。 本期嘉宾 赵昊:清华大学智能产业研究院(AIR)助理研究员/助理教授、光轮智能首席科学家 赵昊,清华大学电子工程系学士/博士,曾任英特尔中国研究院研究员和北京大学联合博士后。赵昊博士专注于几何与认知层面的场景理解及其在机器人中的应用,于计算机视觉与机器人国际期刊和会议(CVPR、ICCV、ECCV、IJCV、CVIU、ISPRS、T-IP、T-MM、NeurIPS、ICLR、RA-L、ICRA、IROS)上发表近 30 篇论文。赵昊博士是清华大学最大的机器人社团“天空工场”的创始人和负责人之一,曾参与孵化 10 余家高新技术创业公司。赵昊博士曾获得 LSUN、Holistic3D、LID 等多项学术竞赛冠军。 时间轴 2:01 DeepSeek 的爆火 6:53 AI 技术的体系结构 17:42 AI 的部署与应用 28:54 AI 部署与提示词工程 53:42 AI 的创造性 57:28 下一个爆发点 内容聚焦 大模型的吸引力与技术突破 DeepSeek 凭借强大的中文处理能力、专业任务的高效表现以及“人工智能觉醒”的感觉吸引了众多用户。此外,大模型在复杂推理任务上的高效处理能力,以及能够展示思考过程的特性,让用户对其智能性有了更直观的感受。这些技术突破不仅提升了用户体验,也为 AI 的广泛应用奠定了基础。 AI 技术的体系结构与未来发展 良好的体系结构在大规模训练过程中能够显著减少系统崩溃的次数,提高训练效率。尽管体系结构的研究曾一度被视为“老派”,但在 AI 的新时代,它重新成为关注的焦点。无论是从学术研究还是商业应用的角度来看,体系结构都是 AI 发展的关键,它不仅影响模型的训练效率,还决定了模型在实际应用中的表现。 AI 在各领域的应用现状与潜力 AI 在医疗、科研、教育、法律等多个领域的展现出了广泛的应用现状和巨大的潜力。在医疗领域,AI 可以作为医生的助手,提高诊断效率;在科研领域,AI 能够帮助研究人员进行文献整理和数据分析;在教育领域,AI 可以辅助教学,提供个性化的学习建议和帮助教师准备“段子”。这些应用展示了 AI 在不同领域的广泛潜力,同时也指出了 AI 在实际应用中可能面临的挑战和局限性。 AI 的部署与未来展望 AI 模型的部署方式包括本地部署和云端部署。本地部署可以更好地保护用户隐私和商业机密,而云端部署则更加便捷,适合快速迭代和大规模应用。此外,AI 在未来需要更好地与人类智慧结合,从而在教育、医疗、法律、娱乐等领域实现更高效的应用。 制作团队 主持人:秦明杨 剪辑:嘉鱼 运营:大壮
参数即权力?小模型如何用“减法逻辑”重构AI基础设施大模型浪潮下,你是否想过,“小”也能创造颠覆?当 DeepSeek 席卷全球时,另一场静默的革命正在发生——从你的手机、汽车到家用机器人,只需几亿参数的小模型,正以更快的响应、更低的功耗,悄然重塑 AI 落地的逻辑。它们如何在终端设备上实现“麻雀虽小,五脏俱全”?又如何与云端大模型协同,构建未来智能生态?本期 DeepTalk 揭开小模型的技术密码:从知识蒸馏到端云博弈,从隐私守护到开源平权,看“小而美”如何撬动万亿级 AI 商业化未来。 本期嘉宾 韩旭:清华大学计算机系助理研究员 主要研究方向为人工智能、自然语言处理、大模型、知识计算。在人工智能及自然语言处理领域会议及期刊发表数十篇,Google Scholar 他引 10000 余次。参与创建大模型开源社区 OpenBMB,相关开源项目在全球最大开源社区 Github 累计获得 6 万余星标。 时间轴 2:20 什么是小模型? 5:37 从技术角度对比小模型和大模型 10:54 小模型是否需要更加优质的数据? 15:44 小模型是否可以完全部署到端侧? 28:30 小模型的应用的优势和局限性 40:18 小模型的多模态 57:28 全球模型竞争中,小模型的竞争状态如何? 内容聚焦 小模型的核心特点 小模型通过精简参数规模(通常为几亿至几十亿)实现高效部署,结合稀疏激活、知识蒸馏等技术,在保持性能的同时显著降低算力与存储需求。其核心优势在于端侧部署能力,适用于手机、汽车、IoT 设备等终端,响应速度快、功耗低,且能通过本地化数据处理保护用户隐私。此外,小模型虽参数有限,但通过与大模型协同(端云互补),可覆盖 80% 的日常任务(如订票、简单推理),复杂任务则依赖云端大模型,形成通用性与专用性结合的智能生态。 技术路径与挑战 小模型的训练依赖知识蒸馏技术,即利用大模型生成高质量合成数据,指导小模型模仿大模型的行为逻辑,从而弥补参数规模的不足。同时,数据质量与芯片适配成为关键:需通过高信息密度数据提升单位参数效能,并针对终端芯片优化算力分配。多模态处理是另一挑战,需分通道编码图像、语音等输入,再融合特征进行跨模态理解,但需平衡存储效率与计算资源消耗。此外,小模型的幻觉问题(因参数少导致知识记忆不足)仍需通过强化数据对齐和上下文学习缓解。 应用场景 小模型在终端设备(如手机、智能家居)中实现本地化智能交互,例如冰箱监测食品状态、机器人理解语音指令。隐私敏感领域(医疗、金融)通过端侧处理数据,仅将复杂分析交由云端,既保障隐私又提升效率。教育场景中,小模型可本地部署为个性化学习助手,避免依赖云端服务的延迟与隐私风险。工业领域(无人机、机械臂)则结合端侧实时响应与云端决策支持,优化控制精度与能耗。 未来趋势与争议 云端协同将成为主流模式:终端处理高频低复杂度任务(如语音唤醒),云端专注高算力需求(如科研分析)。开源生态(如 DeepSeek)推动技术平权,降低企业部署门槛,但需平衡商业化与社区贡献。争议点集中于小模型的幻觉问题、多模态融合的技术瓶颈,以及“模型能力可用性”的评估标准缺失(依赖人工评测或固定测试集)。此外,端侧芯片算力提升可能模糊端云界限,促使小模型向更大参数演进,但需解决功耗与成本的矛盾。 行业影响 小模型推动科技平权,赋能中小企业和个人开发者低成本接入 AI 能力,例如开源框架支持本地化部署。教育领域从技能训练转向思维培养,AI 工具(如代码生成、知识检索)辅助学生聚焦逻辑构建而非机械记忆。人机协作模式深化,AI 在科研、法律咨询中成为“协作者”,但需应对伦理争议(如数据归属)与就业冲击(低技能岗位替代风险)。整体上,小模型与云端大模型共同构建下一代 AI 基础设施,驱动智能技术向普惠化、场景化发展。 制作团队 主持人:冰冉 剪辑:嘉鱼 运营:大壮
人机交互的下一块拼图:机器触觉根据 IDTechEx 的预测,到 2035 年,触觉技术市场预计将达到 71 亿美元。我们也注意到在今年的 CES 上,日本触觉反馈技术提供商 Diver X 推出了一款配备触觉反馈的手套形状的 VR 控制器 ContactGlove2,可以搭配头显使用。韩国 VR 触觉解决方案提供商 bHaptics 也在大会上展示了旗舰触觉背心 TactSuit Pro,支持 Quest、索尼 PSVR2 等的 270 多款游戏,现场观众就能穿着头显与触觉背心,沉浸式体验枪击游戏。 目前在触觉交互方面,国内的应用还没有热起来。但从研究角度,有一些极具代表性的团队。我们希望通过跟这些研究团队中的年轻代表交流,从前沿技术探索的角度,解读触觉技术的发展和应用现状,并畅想一下在未来,触觉技术将如何改变交互体验。 本期嘉宾 张壮:复旦大学青年研究员、博士生导师 研究方向:包括多模式触感交互、柔性与刚柔耦合机器人、折纸工程学等。近三年以第一/通讯作者于 Nature Machine Intelligence, Nature Communications, Science Advances, IEEE Transactions on Robotics 等国际权威期刊发表论文十余篇,担任 ICRA, Cyborg and Bionic Systems, Soft Science 等期刊与顶会的副编及青年编委。曾获中国十大新锐科技人物创新贡献奖、IROS New Generation Star 等荣誉奖项。 童倩倩:鹏城实验室副研究员 研究方向:长期致力于触觉人机交互相关理论方法研究,曾在西班牙多模态仿真实验室(2022-2023 年)做访问研究,荣获 ACM VRST 最佳学生论文奖、IEEE WHC 最佳论文提名奖,入选鹏城孔雀特聘岗位人才计划及“鲲鹏”人才引育计划。 主持人 秦明杨:《麻省理工科技评论》中国社区运营负责人、奥克兰大学计算语言学方向硕士 时间轴 03:49 先来聊聊 CES 上的两个触觉产品 16:10 人的五感和各自的重要性 20:38 怎么定义触觉技术? 26:27 目前的触觉技术距离复现人的真实触觉体验还有多远? 29:18 触觉+AI 带来的想象空间 32:14 目前触觉技术的应用场景有哪些? 38:59 触觉技术的受众都有哪些? 50:18 落地的产品形态 59:40 VR 是必须的吗? 64:22 国际发展差异 74:30 对未来的预测 内容聚焦 本期播客分别从技术和应用的角度,讨论了触觉技术的发展现状、国内外差异,以及从应用角度探讨了针对不同群体、业务场景的应用,以及对未来的展望和期待。 五感与触觉 视觉和听觉是人类获取信息的主要渠道,占据主导地位,被认为是“关键性”的感官。嗅觉和味觉被认为是“辅助性”的感官,主要用于提升生活质量和体验。即使失去嗅觉或味觉,人类仍能正常生活,只是生活质量会有所下降。触觉被认为是“根本性”的感官,它决定了人类对物体的感知和交互能力。触觉在五感(视觉、听觉、嗅觉、味觉、触觉)中具有不可替代的重要性,其与人类的生存和基本生活密切相关。例如,失去触觉的人可能无法完成日常的简单动作,如拿水杯或写字。它不仅是人类感知世界的基础,也是人类与环境交互的核心感官。触觉与其他感官协同作用,提供了更丰富的交互体验。 触觉技术的发展现状 尽管触觉技术在近年来取得了显著进展,但与人类复杂的触觉感知能力相比,仍处于初级阶段。目前的触觉设备主要集中在单一模式的反馈,如震动、简单的按压反馈等,难以复现真实世界中丰富的触觉体验,例如温度、湿度、纹理和多模态交互的复杂性。触觉技术的发展依赖于硬件和软件的协同进步。硬件方面,触觉设备(如手套、背心等)的性能和功能正在逐步提升,但仍有很大的改进空间,尤其是在设备的舒适性、精度和多模态反馈能力方面。软件方面,触觉渲染算法和人工智能技术为触觉内容的生成提供了支持,但由于缺乏高质量的触觉数据集,软件的优化和应用仍受到限制。 触觉技术的发展涉及多学科的交叉,包括材料科学、机械工程、计算机科学、人工智能和神经科学等。这些学科的协同创新为触觉技术的进步提供了动力,但同时也带来了技术整合和优化的挑战。 触觉技术的应用 触觉技术作为一种新兴的交互技术,在多个领域展现出广泛的应用前景。在娱乐领域,触觉技术通过模拟真实触感,如游戏手柄的震动反馈或 VR 设备中的触觉手套,极大地增强了用户的沉浸感和真实感,提升了游戏和观影体验。在医疗领域,触觉技术被应用于手术机器人和康复设备,帮助医生在远程手术中获得更真实的触觉反馈,提高手术精度,同时也为康复治疗提供辅助支持。在工业领域,触觉技术可用于遥操作和工业培训,通过触觉反馈帮助操作人员更好地完成复杂任务,提升工作效率和安全性。此外,触觉技术还在教育领域提供更直观的学习体验,例如通过触觉反馈设备模拟物理实验的触感。在特殊群体辅助方面,触觉技术为视障人士提供导航和环境感知支持,帮助他们更安全地生活。未来,随着技术的不断进步,触觉技术有望在更多领域实现突破,为人类的生活和工作带来更多便利和创新体验。 触觉技术针对不同群体的意义 对于普通消费者,它提升了娱乐和社交体验;对于特殊群体,它提供了重要的补偿和辅助功能;对于专业人士,它提高了工作效率和操作精度;对于科研人员,它推动了对人类感知和交互机制的研究;对于机器人和自动化领域,它提升了交互能力和操作精度。随着技术的不断发展,触觉技术将在更多领域发挥更大的作用,为不同群体带来更多的便利和创新体验。 关于未来趋势的研判 未来触觉技术将在多个方面取得显著进步。硬件层面,触觉技术将朝着多模态反馈的方向发展,能够模拟更丰富的触觉体验,如温度、湿度、纹理和力反馈等。同时,设备将更加轻便、舒适,具备更高的精度和可靠性。软件方面,随着人工智能和大数据技术的发展,触觉内容的生成将更加智能化和个性化,能够根据用户需求和偏好动态调整反馈模式。此外,触觉技术将与 AI、量子计算等新兴技术深度融合,为实现更逼真的触觉体验提供支持。 在应用场景上,触觉技术将广泛拓展至娱乐、医疗、工业、教育等多个领域。例如,在娱乐领域,触觉技术将与 VR/AR 设备深度结合,为用户带来更沉浸式的体验;在医疗领域,触觉反馈将助力手术机器人和康复设备,提升操作精度和治疗效果;在工业领域,触觉技术将用于遥操作和培训,增强操作效率和安全性。此外,触觉技术还将为视障人士、老年人等特殊群体提供更全面的感知补偿,提升其生活质量。随着技术的成熟和成本的降低,触觉技术有望在未来三到五年内实现硬件性能和软件算法的显著提升,并在未来五到十年内形成更完善的生态系统,逐渐普及到消费市场。 嘉宾们还强调,触觉技术的发展将推动人机交互的全面升级,为不同群体带来更丰富的交互体验。未来,触觉技术将与视觉、听觉等其他感知技术融合,形成更自然、更高效的交互模式,为人类的生活和工作带来更多便利和创新。 制作团队 主持人:秦明杨 剪辑:嘉鱼 运营:大壮
AI训练的新数据或将枯竭,合成数据能否解围?就在上周五的 NeurIPS 上,OpenAI 的前首席科学家 Ilya Sutskever 在他的分享中表示:尽管现有数据仍能推动人工智能的发展,但这个行业里称得上可用的新数据已经接近枯竭。正如石油是有限资源一样,互联网中由人类生成的内容也是有限的。我们已经达到了数据的峰值,未来不会再有更多数据,我们必须利用现有的数据,因为互联网只有一个。 Ilya Sutskever 的发言或许反映出数据的发展方向正在发生转变:从依赖海量数据的预训练模型转向更加注重智能体、合成数据和推理等领域。这种转变一定程度上预示着 AI 技术发展的新趋势。 这次,我们选择以数据作为切入点,来讨论一下数据的发展方向,以及在这基础上的 AI 走向。 本期嘉宾 刘子纬:南洋理工大学助理教授 研究领域:刘子纬的研究兴趣涵盖计算机视觉、机器学习和计算机图形学。他博士师从汤晓鸥教授,曾在加州大学伯克利分校(2017-2018 年)担任博士后研究员,后在香港中文大学(2018-2020 年)担任研究助理。刘子纬曾获得多项荣誉,包括 PAMI Mark Everingham 奖、《麻省理工科技评论》亚太区 35 岁以下科技创新 35 人、ICBS 科学前沿奖、CVPR 最佳论文奖候选人以及亚洲青年科学家奖学金。他的研究成果已转化为产品,包括微软 Pix、SenseGo 和谷歌 Clips。 赵昊:清华大学智能产业研究院(AIR)助理研究员/助理教授、光轮智能首席科学家 研究领域:赵昊博士专注于几何与认知层面的场景理解及其在机器人中的应用,于计算机视觉与机器人国际期刊和会议(CVPR, ICCV, ECCV, IJCV, CVIU, ISPRS, T-IP, T-MM, NeurIPS, ICLR, RA-L, ICRA, IROS)上发表近 30 篇论文。赵昊博士是清华大学最大的机器人社团“天空工场”的创始人和负责人之一,曾参与孵化 10 余家高新技术创业公司。赵昊博士曾获得 LSUN, Holistic3D, LID 等多项学术竞赛冠军。 主持人 秦明杨:《麻省理工科技评论》中国社区运营负责人、奥克兰大学计算语言学方向硕士 时间轴 05:11 大模型的训练使用到了什么数据? 12:53 合成数据 vs 生成数据 19:06 合成数据的应用场景 26:33 推理类数据对于自动驾驶和具身智能的意义 29:39 合成数据的生产方式 35:00 自动驾驶和具身智能领域的数据合成方式 38:19 影响合成效率的因素有哪些? 42:00 对学界和业界来说,合成数据的更新频率是怎样的? 45:12 评估合成数据的标准 49:19 合成数据可以被称为是一个产业或者产业链上的一环吗? 55:31 合成数据方面值得关注的方向 62:42 合成数据是否可以迁移到 AI4S 来推动其他学科的发展? 内容聚焦 本期播客分别从学术和产业的角度,讨论了合成数据的概念、生产过程和评价标准,深入分享了合成数据对 AI 产业的重要性,以及未来随着生成数据和合成数据的合并使用,将对 AI 以及 AI4S 的重要意义和发展趋势。 合成数据 vs 生成数据 合成数据(Synthetic Data)和生成数据(Generated Data)是两个在人工智能和机器学习领域中经常使用的概念,它们都涉及到创建用于训练和测试模型的数据集。合成数据是通过模拟或算法生成的数据,它通常基于现实世界数据的模式和分布,但不是直接从现实世界中采集的。生成数据是指利用生成模型(尤其是大模型)创建的数据,这些数据不仅模仿现实数据的分布,而且在某种程度上具有原创性和真实性。合成数据更注重可控性,可以根据特定的需求和规则来生成,而生成数据更注重真实性,它模仿现实世界数据的外观和特征,但可能不完全受控。随着技术的发展,两者被越来越多地被结合起来使用,以发挥各自的优势。 合成数据产业 数据作为 AI 公司核心竞争力的体现,在 AI 发展中处于核心地位。随着 AI 技术的进步,数据的需求和消耗速度增加,合成数据作为一种解决方案,可以帮助突破数据量瓶颈,尤其是在获取真实数据困难或成本高昂的场景中。此外,合成数据产业被视为一个广泛的领域,不仅包括专门的数据供应商,也涵盖了所有涉及数据生产、处理和合成的 AI 工程师和科学家。合成数据在提高模型性能、推动 AI 技术进步以及在特定领域如自动驾驶和机器人技术中的应用潜力巨大。随着中国生产力的发展和对 SaaS 模式接受度的提高,合成数据产业在中国也有望逐渐兴起并成为 AI 领域的一个重要分支。 关于未来趋势的研判 在未来一年内,我们预计会在不同模态数据的融合方面取得显著进展,这对于训练能够理解和处理多种类型数据的统一多模态大模型至关重要。在接下来的 1 到 2 年里,自动驾驶和智能系统领域的闭环仿真器将集成人工智能技术,这不仅将增强它们在感知任务上的能力,还将使它们能够进行复杂决策,从而显著提高生产效率和智能系统的实用性。 视频合成数据预计将给视频理解行业带来重大突破,特别是在多媒体内容理解和监控领域。这些进步将促使互联网公司的算法变得更加智能,进而改善内容推送和用户交互体验。在自然语言处理(NLP)领域,尤其是对于类似于 o1 这样的推理能力,合成高质量的推理数据将有助于提升模型的推理能力,使模型更加智能,能够解决更多复杂的问题。 合成数据和生成数据的融合将成为一个明显趋势,这一趋势旨在结合两者的优势,提高数据的真实性和可控性。在未来 3 到 5 年内,我们可能会看到更加动态和开放的合成数据环境的出现,这些环境类似于电视剧《西部世界》中的概念,使得 AI 系统能够在其中实时获得反馈并不断进化。 此外,合成数据技术有望扩展到生命科学和材料科学等其他领域,从而对这些学科的发展产生深远影响。这些跨领域的应用将进一步推动合成数据技术的发展,并可能在多个行业中引发变革。 制作团队 主持人:秦明杨 剪辑:嘉鱼 运营:大壮
生殖医学前沿洞察:辅助生殖和药物筛选如何助力优生优育,对话翟晶磊与苏俊有报道称,中国有 18.2% 夫妻受到不孕不育困扰。在人类女性一生中大约有 400-500 个卵子发育成熟,但其中 20%-50% 的卵子带有过多或者过少的染色体。染色体数目异常的卵子在受精后会产生发育异常的胚胎,从而导致女性不育、流产或唐氏综合症等遗传疾病。成功受精后胚胎发育异常也会造成胚胎疾病。而与此相对的,是人类对于卵子的发生、胚胎的发育还知之甚少。 本期嘉宾 翟晶磊:中国科学院动物研究所副研究员 从事哺乳动物早期胚胎发育相关研究,利用生物材料构建啮齿类和灵长类胚胎体外长时程培养体系、利用胚胎培养体系研究灵长类动物原肠运动与早期器官发育核心事件、构建灵长类早期胚胎和胚外组织单细胞多组学图谱等。相关研究不仅为发育生物学和再生医学等领域奠定理论基础,更为揭示人类出生缺陷等不良妊娠结局提供技术与数据支持。 苏俊:清华大学生物医学交叉研究院助理教授,北京生命科学研究所研究员 利用不同的哺乳动物模型,结合国际领先的光电镜(如光片活细胞成像,扩展成像、组织透明化成像、大体积电镜)、功能丧失、生物物理(如力生物学测量、建模)等技术,探索卵子和胚胎发育的机制。研究成果将为女性不育的成因和防治提供新方向,并改善现有的医学辅助生殖技术。 主持人 冰冉:中国科学院微生物研究所硕士 时间轴 02:19 生殖医学相关疾病的成因 09:47 胚胎发育相关疾病 12:19 胚胎发育科学研究 15:16 卵子发育的科学研究 24:00 早期胚胎成像与体外培养研究 33:01 如何从实验室转化到临床应用 44:08 未来是否可以实现人工子宫? 46:53 辅助生殖技术的个性化医疗仍比较难 49:03 伦理相关讨论 制作团队 主持人:冰冉 DeepTalk 剪辑:嘉鱼 运营:大壮
在培养皿里复制人体器官,类器官技术已成为个性化医疗的预测工具类器官是一项被麻省理工科技评论列为全球十大突破性技术之一的技术,也是被 science 列为年度十大科学突破的技术,作为一项生命科学的基础研究工具,类器官技术对生物医学产生了颠覆性影响,改进了体外探索生命现象和医学问题的手段和方法,在众多领域都展现出巨大的应用潜力。类器官是一种体外培养的由干细胞分化而来的自组装三维细胞团,类器官具有干细胞对应组织器官的细胞类型和复杂空间形态,能够模拟组织器官的部分功能和生理反应,与来源组织具有极高的相似性。 本期嘉宾 李一伟:华中科技大学教授 生物医学工程系 系主任 研究方向为功能微组织、类器官的构建,重点研究其中相关生物力学、生物物理问题,并构建服务于该研究的高通量的单细胞力学、组学分析技术。他将机械力学设计在微米尺度上与细胞分子信号转导结合起来,实现了带有生物功能的微组织的构建,以及类器官的可控生长调节。 黄琦:约翰·霍普金斯大学博士 研究方向主要是通过设计和制造可折叠的电子器件来实现对于生物类器官的电生理信号测量。开发“微型脑电帽”,能够将脑类器官进行包裹并检测脑电活动信号,可以更好地探索神经系统疾病以及危险化学物质对大脑产生的影响。Frontiers in Artificial Intelligence 期刊组织智能部分审稿编辑。 主持人 王康:中国医学科学院博士 冰冉:中国科学院微生物研究所硕士 时间轴 02:14 什么是类器官 04:32 类器官的尺寸有多大? 06:50 与传统的细胞培养,类器官有何优势? 16:00 培养类器官的技术 20:01 类器官技术的起源与发展 29:44 微流控技术用于类器官培养 35:40 类脑智能研究 43:21 类器官的应用场景与产业——药物筛选 49:45 类器官用于临床前实验 重点摘要 类器官技术被广泛认为是生命科学领域的一项突破性创新,它能够模拟特定器官的结构和功能,帮助研究者理解生命现象,改善药物筛选。今天 DEEPTALK 播客中,分享了类器官的定义、特征及其在医学研究中的应用价值,强调了该技术对于生物医学领域的潜在影响和革新意义。 ● 类脑器官的研究及其科学价值 类脑器官是一种通过干细胞或肿瘤细胞在体外培养形成的具有三维结构、自组织特性的研究模型,其目标在于模仿真实的组织结构和功能,而不仅仅是其大小。这类模型不一定要与真实器官大小相同,关键在于是否能展示出研究对象的结构和功能特征。类脑器官的使用在科研领域有显著优势,相比于传统的细胞培养技术或动物模型,它能提供更接近真实的组织反应,有助于更深入地理解复杂的生物学过程,比如神经元的分化和功能研究。此外,通过类脑器官的研究,科学家能够探索人类大脑的复杂性,为神经科学和疾病治疗提供新的视角和方法。 ● 二维细胞培养与三维器官培养的优缺点 二维细胞培养在精准医疗领域因其高通量和能从特定病人中获得培养方法而显得高效,但缺乏对细胞真实力学环境的模拟,导致结果可能不够准确。相比之下,三维器官培养提供了更接近真实的三维环境和细胞分布,能更好地模拟人体结构,但在技术成熟度、尺度以及某些特定细胞类型的缺失方面仍存在挑战。同时,动物实验虽能提供结构和行为测试,但与人体应用间存在较大差异,且流程耗时,通量较低。类器官技术可能在未来逐渐减少对动物实验的依赖。此外,这种技术在药物筛选和个性化医疗方面也展现出巨大潜力。 ● 类器官培养技术及其应用前景 探讨了类器官培养过程中技术手段的优化,包括搅拌对剪切力的影响和营养物质的供给优化。此外,还提到了类器官与组织工程、微流控技术结合的可能性,以及如何根据特定需求选择合适的培养材料和优化实验设计。此外,通过力学调控,研究人员尝试恢复细胞的干性,不同于传统的基因调控方式,这种方式更侧重于通过细胞外微环境的改变,让细胞自我适应并恢复状态,从而提供了一种可能的细胞重编程新途径。在实践中,这种方法在改善细胞状态和功能恢复方面显示出了潜在的治疗价值和应用前景。 ● 类器官技术在药物筛选和临床前研究的应用 类器官技术为药物筛选提供了新的可能,尤其在肿瘤治疗领域。它能够通过模拟肿瘤微环境,帮助预测特定药物对患者的有效性,从而加速个性化治疗方案的制定。这项技术不仅适用于已知靶点的药物筛选,也能对没有明确靶点的肿瘤进行更精准的药物敏感性测试,为患者提供更为精准的治疗选择。此外,通过缩短药物筛选周期,类器官技术有望加速新药开发,提升患者治疗的效率和效果。 类器官在药物筛选和临床药敏检测方面展现出巨大潜力,能够显著降低药物研发成本并减少对动物实验的依赖。心脏类器官等的应用已取得临床效果,特别是在神经退行性疾病的治疗方面。美国已经通过现代化法案减少临床前动物实验,推动类器官技术发展,已成功应用于药物研发并获得 FDA 批准。欧洲化妆品行业亦趋向采用无动物实验测试。类器官和器官芯片技术被视为未来医药研发的核心方向,有望替代传统动物实验,加速药物开发过程,减少对人类的潜在伤害。 制作团队 主持人:冰冉 DeepTalk 剪辑:嘉鱼 运营:大壮
从手工到智能,实验室自动化能否解放科学家?在工业自动化早已实现的今天,汽车、3C 等制造工厂的自动化流水线随处可见,以生物领域和化学领域为代表的科学研究的生产力却还停留在手工时代,实验室研究迫切需要一场工业革命,实验室自动化的变革或可迎来曙光。与此同时,实验室自动化的实现也面临着技术复杂性、需求非标准化、建设成本与人才资源等诸多问题。 本期嘉宾 温正慧:甬江实验室特聘研究员 围绕高附加值的精细化学品与医药中间体,利用连续光催化和连续多步合成策略,结合工程设计与机理研究手段,实现化学合成方式的变革;开展新型自动化流动合成系统在小分子药物和有机合成中的研究及人工智能算法在合成路径规划、工艺优化、反应预测等领域研究;通过系统集成、反应器设计、工艺优化等手段,实现大规模连续光催化合成。 刘家朋:汇像科技 CEO 汇像科技将 AI 和生命科学及高通量实验相结合,致力于为合成生物学、药物筛选、微生物检测、细胞检测、分子检测等领域提供全流程的自动化、智能化综合解决方案,产品范围涵盖从食品安全、药品安全到生命科学领域的智能机器人工作站系统、智能化整合系统以及配套的仪器设备及相关耗材等。 主持人 冰冉:中国科学院微生物研究所硕士 时间轴 03:21 科研为什么需要实验室自动化? 08:45 实验室自动化当前的发展阶段 19:55 实验室自动化的云端协同 24:15 实验室自动化是一个综合的应用领域 28:25 标准化的实验室自动化产品是未来发展趋势 29:57 履带 or 机械手? 31:50 数据管理与实验室共享所带来的顾虑 38:18 实验室自动化在光化学与其他学科中的应用 41:41 实验室自动化技术实现的挑战 45:11 实验室自动化的商业化进展 重点摘要 本次播客聚焦于实验室自动化,讨论了实验室自动化在提高实验效率、降低人力成本以及提升实验结果一致性方面的巨大潜力,特别是利用自动化技术改善化学反应条件的优化和筛选过程与使用 AI 和自动化解决生命科学和化学问题上的经验。 ● 推进实验室自动化:价值、意义与未来发展 实验室自动化经历了从手工操作到自动化、智能化的转变,未来将实现更高效的科学研究和数据分析。实验室自动化在不同领域的应用包括但不限于生命科学、微生物学、化学等领域,以及如何通过标准化、平台化技术、AI 技术来满足不同学科的需求。强调 AI 不仅可以用于驱动智能化设备或集成系统,还可以辅助科学研究,使科学家能专注于数据分析的判断。 ● 实验室自动化在化学领域的应用与发展 实验室自动化技术应用于化学和材料领域,提高了化学合成、新材料开发及催化剂设计等方面的效率与可行性。自动化技术可以用于优化和执行多步化学合成过程,包括有机合成、药物分子的合成以及催化剂的设计和测试。这不仅提高了合成的效率,还增加了实验的可重复性。能够快速筛选不同的反应条件,如温度、压力、溶剂和反应时间等,以找到最佳的合成路径。在分析化学中,自动化技术被用于样品的前处理、色谱分析、质谱分析以及其他分析方法,提高了分析的通量和准确性。 ● 探索自动化系统的关键技术与未来发展 实验室自动化通过整合不同自动化设备和技术,可以显著提高科研效率和设备使用率。在自动化系统的核心技术上尤其是设备间的协同、错误处理机制、数据分析与利用以及标准化是极其重要的关键技术,强调了设备串联与协同工作的复杂性,以及通过迭代过程形成标准产品的必要性。同时探讨了不同技术路径的选择,如履带式和机器人手臂的应用,以及 AI 赋能和云平台对于提升自动化系统性能的作用。云计算与云管理的发展使得实验过程能够实现标准化和自动化,并促进跨实验室资源共享与协作,进一步提升了研究的效率和成功率。此外,结合 AI 和机器学习技术对实验过程进行预测和优化,将进一步增强实验室自动化的功能。 ● 自动化实验室在科学研究中的挑战 随着科学家和产业界的努力,实验室自动化取得了进展,但在实践中仍面临多项挑战,包括跨领域技术的整合、设备兼容性问题以及如何使自动化系统更好地服务于科研人员等,包括技术复杂性、需求的非标准化、设备成本高、国产化替代、所需专业人才稀缺等问题。 制作团队 主持人:冰冉 DeepTalk 剪辑:嘉鱼 运营:大壮
马斯克的脑机接口已实现意念操作游戏,人机交互方式迈入新纪元?近日,马斯克的 Neuralink 已为第二位人类成功植入脑机接口,用 400 个电极工作。此前首位患者仅靠思想控制,即可下国际象棋。Neuralink 的首个产品是帮助神经元受损的人重新恢复身体功能;第二个产品是为了让盲人能够看见。马斯克更是对 Neuralink 和人类未来的关系,给予了最高的期望和评价——改善 AI 与人共生。虽然脑机接口的概念早在几十年前就已经提出,但直到马斯克创立了 Neuralink 才真正被引爆,马斯克的强大号召力使脑机接口正式进入大众视野,同时也得到了资本的青睐。 本期嘉宾 张沕琳:清华大学电子工程系长聘副教授 长期致力于面向生物医学的低噪声低功耗电路设计与系统集成方法学研究。针对脑科学前沿研究对无线小型化神经接口的强烈需求,提出了高能效高精准信号传感、高能效高吞吐无线收发、高效无线供电、高编码深度指令生成等多项关键电路设计方法。 曹路:西湖大学助理研究员 带领项目团队克服了芯片植入和复杂脑信号解码的技术难题,在低功耗高通量脑机接口芯片和汉语语言解码两方面实现突破。 主持人 冰冉:中国科学院微生物研究所硕士 时间轴 02:20 人类为什么需要脑机接口? 07:04 侵入式与非侵入式脑机接口的差异 11:36 脑机接口与传统的人工耳蜗有何异同 22:30 脑机接口在医疗领域的应用——运动能力、视觉能力、语言能力 21:33 脑机接口在非医疗领域的应用的优势与困难 37:29 如何评价一个脑机接口的技术方向与路径 42:05 相关的技术挑战有哪些——温控、算法、数据 51:38 脑机接口的前沿进展 54:10 脑机接口尚未形成巨大产业 重点摘要 脑机接口技术被视为改善人机交互的一种革命性途径,不仅能用于治疗疾病,还能提高人类生活的质量和效率。尽管目前技术仍处于初级阶段,但随着医学和科技的发展,脑机接口有望实现更广泛的应用,包括更高效的信息传递等,从而彻底改变人类与机器互动的方式。 ● 从基本到高级的技术演进与未来发展 脑机接口技术,作为连接人类大脑与机器的桥梁,经历了从初步的人机交互到高阶的思维传输的转变。早期应用如人工耳蜗为残疾人士带来了希望,但局限于简单的数据传输。随着技术进步,未来的脑机接口或将实现更复杂的双向信息交换,人们可通过思考直接控制外部设备或完成任务。脑机接口技术中电极片数量对信息采集的重要性,指出电极片越多,能够传输的信息量越大,从而实现更精准的大脑意图解析和身体动作控制。 ● 从基础研究到应用开发 目前脑机接口领域的研究尚处于初级阶段,复杂功能的实现仍需大量基础医学和神经生物学的研究。脑机接口技术依赖于众多学科的基础,包括但不限于医学、神经科学以及材料科学等,并涉及生物学机制、器件研发、电路设计等多个方面。近期可期待的技术进展包括基于运动、视觉和语言的脑机接口应用。其中,视觉方面的研究较为成熟,预计未来一两年内会有显著成果。而语言解码技术虽然挑战重重,但也已有成功案例。特别强调了通过脑机接口技术帮助残疾人恢复肢体功能和改善生活质量的可能性。 ● 脑机接口技术在医疗与非医疗领域的应用及其挑战 医疗领域内对于侵入性和非侵入性的脑机接口设备均有特定的需求和标准,例如在体内的有源电子设备需要保证生物安全,避免对大脑组织造成损伤。非医疗领域的应用则更倾向于非侵入式的解决方案,但由于技术限制以及用户体验问题,目前还难以实现有效应用,脑机接口技术的发展应以解决问题为导向,合理权衡信息量、侵入性以及成本等因素,并需考虑到实际应用场景和用户需求的多样性。 讨论了脑机接口技术发展中遇到的两大挑战:算法的重要性和数据获取的难题。强调高质量数据的稀缺性及对非侵入式数据收集的技术限制。提出了建立脑电数据大型库的建议,以促进研究进展和应用发展。 ● 探索脑机接口技术的未来发展与潜在形态 聚焦脑机接口技术的未来可能性,探讨了其如何可能替代传统手机形态,并设想了融入日常生活的各种方式。提出了脑机接口技术最终可能导致的手机替代品将更加接近人类的习惯交互方式,成为连接人与越来越聪明的人工智能之间的桥梁。同时,讨论了该技术在医疗、娱乐、安防等多个领域的应用潜力及面临的挑战。强调了对这项前沿技术保持乐观态度的重要性,并期待其在未来给人类生活带来积极影响。 制作团队 主持人:冰冉 DeepTalk 剪辑:嘉鱼 运营:大壮
机器人技术的下一次革命:更灵活、更安全的软体机器人说起机器人,你首先想到的是不是特斯拉的钢铁机器人,亦或是小米的铁大机器人,实际上,机器人不一定是拥有金属外骨骼的“硬”机器人,比如《超能陆战队》里面机器人大白,这样的软体机器人,在研究领域也颇受关注。软机器人由于其自身的材料组成和结构特性,具有交互安全、适应性好、灵活性强等特点。如今被广泛应用于医疗服务、农业收获、救灾救援、水下探测等领域。本期我们就来聊聊软体机器人技术。 本期嘉宾 李曙光:清华大学机械工程系 副教授 研究方向主要包括模块化机器人、集群机器人、折纸/折叠机器人、软体机器人,以及类生命机器人相关技术和应用,特别是基于 AI 辅助的机器人自动设计、自动制造、自组装、自组织和自适应技术。研究工作涉及机械、电子、计算机、材料、生物、物理等多个学科知识的交叉融合。 吴志刚:华中科技大学机械科学与工程学院 教授 长期从事人形结构仿生机器人、具身智能软体机器人、数字(AI)驱动的智能软体设计与制造,承担了多项国家基金重点、面上项目,重大研发课题等科研项目,取得了多项创新成果。包括仿生灵巧手设计、深度学习物体操作规划、人体运动感知和触觉传感器设计;可编程折纸机器人、软磁机器人、气动机器人、仿生机器人等。 主持人 冰冉:中国科学院微生物研究所 硕士 时间轴 02:00 软体机器人与柔性机器人的异同 05:39 与刚性机器人的差异 13:10 软体机器人是否能实现类似于人体的操控方式 17:29 软体机器人的大小尺度:纳米级至米级 22:30 在哪些场景下软体机器人更具优势 27:50 软体机器人的构成模块部分 31:04 驱动与能源系统 33:55 柔性软材料的力学性能——活塞 35:35 材料领域是否能满足当前需求 38:50 AI 赋能下的软体机器人研究 49:18 软体机器人的传感器 53:40 软体机器人的已开展的应用领域:医疗、工业、农业 1:00:40 从实验室到商业化还有哪些要做的事 重点摘要 软体机器人以其柔软的材质、良好的交互安全性和适应性受到关注。相较于传统的刚性机器人,软体机器人使用硅橡胶、水凝胶等软性材料制成,能够在复杂环境中安全作业,并且具有更好的灵活性和可进入性。它们的研究和应用领域广泛,包括医疗、农业救灾和探测等。软体机器人的发展标志着机器人技术的进步,特别是它们在与人类和环境交互方面的独特优势。 ● 探讨软体机器人在安全性和灵活性方面的优势 软体机器人的两个主要优势:安全性与原材料带来的容错性。软体机器人在与人、环境及物体交互时具有较高的安全性,且其操作无需高度精确度便能完成任务,这一点对于日常生活中机器人的应用尤为重要。此外,软体机器人的柔顺性可以通过材料和本体结构来实现,也可以通过算法来优化,让软体机器人更好地适应各种环境和任务。 ● 探索软体机器人的尺寸、驱动与能源系统 对于软体机器人的尺寸,一方面,软体机器人可以做得非常小,其最小尺寸受限于制造技术而非材料,小至达到纳米级别,用于执行特定功能如纳米操作。另一方面,大型软体机器人的发展受到物理法则的制约,例如自重和支撑能力,但仍有可能实现米级甚至更大的规模。 软体机器人技术通常包括本体、控制、感知及能源系统。其采用柔性材料,能在不同尺度下执行多样化任务。驱动系统多样,如光、声、热或化学反应等外部能源。通过创新设计,软体机器人展现出独特优势,如通过软体机器人活塞以达到力的放大。 探讨了人工智能(AI)如何应用于材料科学和软体机器人设计中的应用,如开发软体机器人理想的材料、改变材料的物理属性来制作灵活的传感器等。 ● 探索软材料的潜力与开发 当前软材料因其丰富多样性和可塑性,为我们开辟了创造前所未有的物品的可能性。然而,相对于传统硬材料的稳定性和成熟解决方案,软材料的应用和发展仍面临诸多挑战,包括对其特性的快速变化缺乏深入理解以及处理经验的不足。尽管如此,新材料的研发工作正不断推进,借助人工智能等先进技术,有望加速材料设计和优化过程,使之更好地满足特定需求,如提高力的响应性或实现特定功能。此外,通过创新的结构设计和利用超材料原理,我们能够赋予软材料以独特而先进的性能,例如调控光的行为,从而开启更多科学与工程领域的应用前景。 ● 探索软体机器人的应用与前景 如在医疗方面,通过使用能够进入人体自然腔道系统的软性导管式机器人,实现对心血管和脑部疾病的治疗。利用软材料制造的微型机器人在康复训练等方面的可能性,以及这种柔软性质对于改善用户体验的重要性。在救援领域软体机器人用于处理受限空间和非结构性环境下的搜救任务,如地震废墟中的生命搜索。以软性机械手为例,其无需精确感知目标物体尺寸即可完成抓取任务的能力,尤其适用于抓取硬脆且易碎的物品,如果实采摘、太阳能面板抓取等。 制作团队 主持人:冰冉 DeepTalk 剪辑:嘉鱼 运营:大壮