

用人类脑电波教 AI 开车,清华 90 后学者龚江涛直言隐式信号里藏着 AGI 的关键 | 万有引力“老司机的第六感”能不能被 AI 学会? 本期《万有引力》邀请清华大学智能产业研究院助理教授龚江涛,揭秘如何用人类脑电波教 AI 开车。当语言无法描述驾驶直觉时,大脑的隐式信号成为了具身智能的新突破口。从 E³AD 研究到脑机接口终局,从跨学科科研的“趟坑”故事到未来 AGI 的认知伙伴愿景。一起聆听这场关于“不可言说的智能”的深度对话,看 AI 如何读懂人类的“言外之意”。 👤 本期嘉宾 龚江涛,现任清华大学智能产业研究院助理研究员,曾任联想集团研究院技术战略与创新孵化平台高级研究员,负责智能交互系统创新。博士师从清华大学未来实验室主任,教育部长江学者,徐迎庆教授。博士后合作导师为联想集团全球CTO芮勇院士及联想集团副总裁王茜莺博士。 龚江涛博士的主要研究方向是学习、驾驶、工作等强认知活动场景中的智能系统设计及具身认知增强的类人智能体。有丰富的跨学科交叉学习研究经历:本科就读于清华大学软件学院,并获得了数字娱乐设计的第二学位;研究生阶段直博至清华大学未来实验室,进行基于认知行为科学、认知神经科学的人机交互研究,获得北京市优秀博士毕业生、系毕业生代表等荣誉。龚江涛曾作为子课题负责人承担了包括国家重点研发计划、北京市科委多项纵向科研项目,在顶级人机交互会议(如CHI、CSCW、UIST和IMUWT)以及顶级人工智能/机器人会议(如ICRA、IROS、WWW、ICCV和ICLR)上发表了40余篇相关研究工作,获得30余项国内外发明专利。还担任过CHI和CICAI的Associate Chair、Paper Session Chair和Demo Chair。承担国家自然科学基金、科技部重点研发项目子课题、北京市自然科学基金多项,曾获人工智能协会outstanding service award,北京冬奥组委项目及个人感谢信等荣誉。 💡 精彩看点 * 脑电波教 AI 开车:深度解析 E³AD 研究,如何利用 EEG 信号捕捉人类驾驶时的“风险预判”,让自动驾驶学会“老司机的直觉”。 * 身体会“说话”:当语言无法表达时,如何通过眼动、脑电等隐式信号,挖掘人类未被言说的认知数据。 * 跨界科研的“趟坑”之路:从计算机、美院到脑科学,如何在“无人区”争取资源、定义新范式? * 具身智能的未来:脑机接口会是终局吗?当脑电大模型(Large Brain Model)遇上物理世界,AGI 将如何进化为人类的“认知伙伴”?
对话玉伯:“前端之神”的 AI 新战事 | 万有引力玉伯 ,这个在技术圈如雷贯耳的名字,曾定义了无数程序员 的“技术梦”。从阿里前端 第一人,到语雀创始人、飞书副总裁,再到如今创立 YouMind ,他似乎总在攀登新的高峰。然而,剥离掉所有光环,此刻坐在聚光灯下的,只是一个渴望“言行一致”的#创业者 。 离开大厂的温室,他在创业的荒原上遭遇了怎样的“苦涩教训”?为何在众人眼中的功成名就之后,他却发出“后悔出来晚了”的感慨?在全球产品经理大会 上,CSDN 执行总编唐小引与玉伯展开了一场触及灵魂的深度对话。这不只是一次行业访谈,更是一个理想主义者在 AI 时代,如何用“诚实”对抗焦虑、用“节奏”抵御浮躁的真实独白,欢迎收听本期《万有引力》~
AI 正在重塑开源?蚂蚁集团王旭:20年开源老法师的深度预判在 AI 席卷全球的今天,开源不再仅仅是代码共享,它正在成为企业生存的核心竞争力。从“玩”开源到“用”开源,再到主导国际顶级项目,这中间的鸿沟如何跨越? 【嘉宾介绍】 王旭 (Xu Wang),蚂蚁集团开源技术委员会副主席,深耕开源领域 20 余年。他是国际知名开源容器项目 Kata Containers 的创始人之一,目前负责蚂蚁集团在云原生、AI 基础设施等领域的开源战略布局。本期视频,CSDN 执行总编 唐小引 特邀这位“开源老法师”,深度拆解企业级开源的底层逻辑。 【精彩看点 Highlights】 * 🛣️ 从"玩票"到"主导":王旭分享 20 年开源路,个人开发者如何通过开源改变职业轨迹? * 🏢 大厂开源方法论:蚂蚁集团如何平衡内部 KPI 与外部社区贡献?企业开源的商业闭环怎么做? * 🤖 AI 重塑开源范式:当模型成为核心,传统的开源协作模式失效了吗?AI 基础设施开源的新机会在哪里? * 📦 Kata Containers 实战:一个中国团队主导的项目,如何一步步成为 OpenInfra 顶级项目? * 🌏 中国开发者的突围:在复杂的国际形势下,中国技术人如何在全开源社区建立影响力? * ⚖️ 治理的艺术:企业主导 vs 社区自治,如何避免项目"烂尾"或被厂商绑定? * 🔮 未来趋势预测:下一代开发者将如何参与开源?GitHub 还是 Hugging Face? 本期内容出自《开源成就访谈》节目,文字版可参见: 《开源成就访谈|二十载开源路,如何从“玩家”到生态“塑造者”》
空间智能爆发只需24个月?群核科技首席科学家唐睿预言:具身智能才是AGI终极形态 | 万有引力“具身智能(Embodied AI)是人类技术的终极形态之一。”但如果没有空间智能,机器人就像在黑暗中摸索。从屏幕里的 3D 设计到物理世界的机器人交互,硬件的"爆点"何时到来?唐睿博士大胆预测:只需 24 个月! 【嘉宾介绍】 唐睿,群核科技首席科学家,英国巴斯大学博士,现任中国图学学会专业委员会委员,图形学与混合现实研讨会执行委员。师从浙江大学副校长陈刚教授与英国皇家工程院士Darren Cosker教授,长期从事计算机图形学、人工智能与具身智能感知领域工作。在ACM TOG,ECCV,CVPR,Siggraph, Sigraph Asia等国内外高水平学术会议和期刊发表论文20余篇,获中国和美国授权专利57项;担任ACM TOG、Nature子刊等计算机与人工智能领域期刊审稿人。 在群核深耕 10 年,他正带领团队打造“3D 界的 ImageNet”。本期《万有引力》,CSDN 执行总编 唐小引 与本家唐睿老师展开了一场关于 AI、空间与未来的深度对话。 【精彩看点 Highlights】 🦾 概念辨析:空间智能是具身智能的基石?为何说具身智能是 AGI 的终极目标? 🔄 技术演进:从传统 CG 渲染到 2017 年拥抱 AI,群核科技如何完成技术基因的进化? 📊 数据护城河:正在构建"3D 界的 ImageNet"!商业化数据如何反哺学术研究? 🏠 室内 vs 室外:为何马斯克的自动驾驶数据采集模式,在室内机器人领域行不通? 🌍 世界模型之争:视频生成(Sora)vs 3D 生成,谁才是通往世界模型的正解?唐睿为何选择"融合路线"? 🔮 重磅预言:硬件采集设备的普及将带来"空间数据爆点",倒计时 24 个月! 👨💻 职场进阶:从写代码的 IC 到管理团队的首席科学家,如何克服"技术人员的痛苦"? 🔓 开源策略:Spatial-LM 模型开源背后的商业逻辑与生态布局。 💡 专家建议:给开发者的 8 字箴言——Be Critical, Be Creative(批判与创造)。 【互动话题】你认为具身智能(机器人)走进千家万户还需要几年?24个月后的硬件爆点真的会来吗?欢迎在评论区留下你的看法!👇👇 别忘了订阅我们的频道,点赞 👍 并开启小铃铛 🔔,不错过任何前沿科技对话!
DeepMind 前大神亲述:通用人工智能离我们还有多远?|《万有引力》对话王佳楠离开全球最顶尖的 AI 实验室 Google DeepMind,投身具身智能(Embodied AI)浪潮,是一种怎样的体验?当大模型遇到机器人,物理世界的交互将被如何重塑?本期视频,带你一探究竟! 【嘉宾介绍】 王佳楠现任星尘智能副总裁,专注于机器人技术与人工智能的融合创新,主导并推动公司自研的全身VLA模型取得突破性进展。她于2018年获牛津大学计算机科学硕士学位,曾在DeepMind与IDEA研究院担任研究员与工程师,深入探索学习理论、生成模型及以人为中心的AI算法。其研究成果发表于ICLR、NeurIPS、CVPR等国际顶级会议及《自然》期刊。她长期关注智能体在动态环境中的持续学习与适应,致力于解决灾难性遗忘与推进组合式迁移学习。 作为从世界顶级 AI 研究机构走出的实战派,她在本期节目中与 CSDN 执行总编唐小引深度对话,分享从算法研究到商业落地的独家思考。 【精彩看点 Highlights】 * 🏢 DeepMind 内部揭秘:在全球最神秘的 AI 实验室工作是什么体验?它的创新文化有何独特之处? * 🔄 职业转型的思考:为什么在 AI 纯软件研究的巅峰时期,选择转向 "又苦又累" 的机器人硬件领域? * 🤖 具身智能的未来:ChatGPT 拥有了身体会怎样?大模型如何赋能机器人完成复杂任务? * 🌏 中英 AI 差异:从英国伦敦到中国深圳,前沿技术环境与创业氛围有哪些不同? * 💡 给年轻人的建议:想进入 AI 和机器人领域,现在应该补齐哪些技能树? * 🚀 星尘智能的野心:如何打造让机器人像人一样学习和工作的未来?
辛顿、杨立昆等 AI 先驱都源自信号处理——对话 IEEE 首位华人主席、美国双院院士刘国瑞 | 万有引力Geoffrey Hinton(辛顿)和 Yann LeCun(杨立昆)这些 AI 巨头,其实都源自信号处理领域? 60 岁功成名就,为何放弃终身教职,选择“从零开始”全职创业? 除了视觉、听觉,AI 如何通过无线电波赋予人类“第六感”? 本期《万有引力》,我们荣幸邀请到了 IEEE 历史上首位华人主席、美国国家工程院与发明家科学院双院院士——刘国瑞(K. J. Ray Liu)教授。从台湾嘉南平原的调皮少年,到打破美国学术界“玻璃天花板”的领袖,刘教授的人生本身就是一部传奇。 在这次深度对话中,刘教授不仅犀利指出了大众对 AI 历史的误解,直言“计算机科学当年只是教编程”,更硬核科普了全球独家的“无线 AI”技术——无需穿戴设备即可监测呼吸与跌倒。他更以“冲浪”为喻,分享了如何度过 35 岁危机,以及他在马里兰大学执教 30 余年、培养出 14 位 IEEE Fellow 的“魔鬼训练法”。 无论你是科研工作者、工程师,还是对 AI 未来和人生哲学感兴趣的朋友,这期视频都将带给你全新的视角与启发! 精彩看点 (Highlights) 🚀 AI 的真正起源 刘教授指出,现代 AI 的许多基础算法理论(如机器学习、神经网络)都演变自信号处理(Signal Processing)。在计算机科学(CS)还主要关注操作系统和编程的年代,EE(电机工程)才是数学与物理的集大成者。 📶 无线 AI:人类的“第六感” 不仅是通讯!刘教授创办的 Origin Wireless 正在做一件改变世界的事:利用周围的无线电波(如 WiFi)来“感知”环境。从监测老人跌倒到防止儿童被遗忘在车内,这项技术正在拯救生命。 🔥 直击行业痛点:合成数据 vs 真实数据 针对英伟达黄仁勋(Jensen Huang)关于合成数据重要性的观点,刘教授给出了不同的见解。他认为合成数据只是“没办法中的办法”,真正的突破必须依赖物理世界中产生的真实数据,这也是他离开“象牙塔”投身工业界的原因。 👨🏫 “每个学生都在我办公室哭过” 作为严师,刘教授的门下走出了 70 多位博士及博士后,其中 14 位当选 IEEE Fellow。他分享了独特的教育理念:不给具体题目,只给大方向,逼学生学会“问出好问题”。 🌊 人生哲学:做一个时刻准备好的冲浪者 面对 35 岁危机和人生低谷,刘教授提出了“冲浪理论”:人生不会只有一个浪头,关键是你是否有真才实学,当下一个大浪来临时,你能否稳稳地站上去? 💬 互动话题 你如何看待“无线 AI”在未来的应用前景?你认为它会取代可穿戴设备吗?欢迎在评论区留下你的看法! 👇 别忘了订阅我们的频道,点赞并开启小铃铛,获取更多科技大佬的深度访谈! #刘国瑞 #IEEE #人工智能 #无线AI #信号处理 #创业 #科研 #深度访谈 #CSDN #RayLiu #OriginWireless #人生哲学 #教育
对话王咏刚:AI 已经掀翻初级程序员饭碗,编程教育和职业培训班的意义都不大了 | 万有引力⚡️ “不和 AI 协作过多少项目,你就不是合格的程序员” 以前我们常说:“不写满十万行代码,成不了好程序员。” 但在今天,王咏刚老师抛出了一个更扎心的暴论:在这个时代,如果你还只盯着语法和算法,可能连初级程序员的饭碗都保不住了! 🤯 本期《万有引力》,CSDN 执行总编唐小引深度对话 Mootion AI创始人、前创新工场AI工程院执行院长王咏刚。作为穿越了互联网、移动互联网到 AI 时代的“老法师”,他不仅身体力行地让 AI 主导了团队的代码开发,更在视频生成(Video Generation)的深水区摸爬滚打。 这一期,我们不聊虚的,只聊最残酷的行业真相和最前沿的实战心法!👇 🔥 本期硬核看点 🤖 AI 已经彻底解决了编程问题? 王老师认为,AI 在逻辑和形式化语言(如代码)上已经达到了极高水平,但在需要“Insight”和真正艺术创造力的领域,它可能还只是个“小学生”。 📉 程序员的危机:不是工具的竞争,是人力资源的替代 如果你觉得 Cursor 只是个 IDE,那就太天真了。老板们算的账是:既然 Claude Coding 能干初级程序员的活,且只要 200 美金,为什么还要招月薪 2 万的实习生? 🎥 视频生成的“塑料感”魔咒 为什么 AI 生成的视频总有一眼假的“塑料味”?从“抽卡”到与专业导演建立工作流,王老师揭秘了让 AI 懂“电影感”的独家秘籍。 🌍 Mootion 的中东奇幻漂流 一个 AI 视频工具,如何在不经意间拥有了 300 万海外用户,甚至成为了中东中学老师的“教学神器”?(避坑指南:在中东千万别让 AI 画先知!) ⏳ Transformer 的天花板与“三个月魔咒” 为什么绝大多数 AI 应用的用户生命周期只有 3 个月?为什么当下的 AI 可能只能达到人类知识的“平均水平”? ⏱️ 时间轴导航 00:00 精彩预告:投身 AI 创业浪潮的初心 08:18 范式转移:我现在一行代码都不写,只负责 Review AI 14:39 AI 的创造力边界:擅长模仿和组合,但缺乏灵魂和 Insight 19:41 暴论:Transformer 架构的上限可能就是人类的“平均水平” 22:57 拒绝“塑料感”:如何用导演思维调教 AI 视频生成 37:49 降维打击:AI 短剧如何颠覆传统 2D 动画工业流程 49:53 出海实战:Mootion 如何在中东教育市场狂揽 300 万用户 55:01 职业危机:AI 正在替代“人力资源”而非“编程工具” 01:05:00 未来已来:从“代码工人”到“AI 架构师”的转型之路 💡 思考与讨论 看完视频,你感到焦虑还是兴奋? 💬 作为程序员/创作者,你现在工作中有多大比例是由 AI 完成的?你觉得“初级程序员”这个岗位未来还会存在吗? 欢迎在评论区留下你的看法,我们一起讨论!👇 🔔 喜欢本期内容请点赞、订阅,并开启小铃铛,不错过每一次技术认知的升级! #AI编程 #程序员失业 #王咏刚 #CSDN #AIAgent #视频生成 #Sora #创业 #ChatGPT #Claude #Cursor #Mootion
对话清华大学教授刘嘉:编程的本质不是写代码 | 万有引力🎙️ 本期导读 当 AI 能写代码 ,程序员就又面临“取代”危机。 本期《万有引力》,我们邀请到了清华大学基础科学讲席教授、心理与认知科学系主任刘嘉。他表示:“我从来不认为编程的本质是在写代码(Code),编程的本质是通过机器来解决问题,它的核心是问题解决。编程高手是在想怎么通过一条有规则的方式,把一个复杂问题给解决掉,计算机程序只是他的工具而已。Cursor 本身不具有解决复杂问题的能力,它只是执行者。人的这种复杂问题解决能力,是没有被 AI 所取代的。”但他同时也警示:“知识密集型的岗位会消失掉90%、95%,但它会让TOP 5%具有稀缺性的人活下来。” 这不仅仅是一场关于技术的硬核对话,更是一份 AI 时代的生存指南。刘嘉老师用“脑科学”这把手术刀,剖开了 AGI 的本质,也为我们在这个充满不确定性的时代,提供了一套像大模型一样自我进化的“人生算法”。 👨🏫 嘉宾介绍 刘嘉 * 清华大学基础科学讲席教授 * 清华大学心理与认知科学系主任 * 长期从事脑科学与人工智能的交叉研究,致力于探索通用人工智能(AGI)的生物学基础与实现路径。 🎧 核心话题 01. 一次跨越 20 年的“错过”与“重逢” * 1997 年,刘嘉远赴 MIT 求学,向“人工智能之父”马文·明斯基问道,却被劝退:“AI 寒冬已至,不如做脑科学。” * 这一别就是 20 年,让他完美错过了深度学习的爆发期。 * 2016 年 AlphaGo 之后,他为何决定重返 AI?这段“弯路”如何让他获得了更底层的洞察? 02. 莫拉维克悖论:为什么 AI 干不了体力活? * 大脑皮层(推理)vs 小脑(运动):进化的时间尺度决定了模拟的难度。 * 前额叶只有 300 万年历史,功能最弱,最好模拟;而主管运动的小脑经过了几亿年进化,密度最高,难以攻克。 * 金句:“推理、AI Coding 都只是模仿生物智能万里长征中迈出的第一步。” 03. Scaling Law:智能的第一性原理 * 为什么“大”永远是对的?从生物进化看,人类大脑变大是智慧产生的必要条件。 * 对 Scaling Law 的质疑往往源于资源不足的“酸葡萄”心理。 * 刘嘉的“苦涩教训”:曾以为 GPT-3 是“傻大粗”,后来才发现自己忽略了智能的第一性原理。 04. 通往 AGI 的路线之争:为何 NLP 最终胜出? * 强化学习(模仿行为)、脑模拟(模仿神经元)、NLP(模仿思维),三条路线为何只有 NLP 跑通了? * 因为 NLP 压缩了人类已有的所有知识(Known Unknowns),而其他两条路面临数据匮乏或生物机制的“未知的未知”。 05. 学术界 vs 工业界:不同的使命 * 学术界做 0 到 1:探索不存在的路径,允许失败,寻找颠覆性创新。 * 工业界做 1 到 100:追求极致的工程化与商业落地,赢者通吃,残酷且不容共存。 06. 未来生存指南:95% vs 5% * 知识变得不再值钱:大模型让知识获取成本趋近于零。 * 残酷的预测:95% 的知识密集型岗位(如普通程序员、初级律师)将消失;只有 Top 5% 具备“从 0 到 1”创造力的人能活下来。 * 人生优化算法: 目标函数:定义你的人生目标。 随机梯度下降:不断试错,快速迭代。 注意力机制:在这个噪声世界中,只关注高质量的数据和人。 💡 适合谁听 * 对 AI 底层逻辑和未来发展感到困惑或焦虑的技术从业者。 * 关注 AGI、脑科学、心理学交叉领域的探索者。 * 希望在 AI 时代找到个人定位与进化路径的普通人。 在这里,我们不贩卖焦虑,只提供看透本质的理性思考。欢迎收听本期节目,一起探索如何与 AI 共进化。
对话张笑宇:涌现、AI 带来裁员的结果都是必然 | 万有引力本期《万有引力》对话“文明三部曲”作者张笑宇,我们尝试从社会工程学的角度,分析 AI 对于我们的职业,尤其是程序员,究竟会带来怎样的变化? 🎙️ 导读:当人类站在 AI 文明的门槛上 💡 核心话题 1. 为何我们都是“史前动物”? * 张笑宇老师提出一个震撼的观点:在 AI 文明面前,我们现有的历史和经验都属于“史前史”。 * 即使我们拥有几千年的哲学积累,面对这次技术爆发,人类如同还没进入真正文明阶段的生物,正在经历一场从碳基文明向硅基文明过渡的剧变。 2. 从“符号主义”到“连接主义”的变迁 * 回顾 AI 发展史,早期的 AI 试图模仿人类的逻辑思维(符号主义),这条路走了几十年最终“撞墙”。 * 现在的突破(大模型)走的是“连接主义”道路,不再强求机器像人一样按逻辑推理,而是通过海量数据涌现出智能。这颠覆了我们对“思考”的传统定义。 3. 程序员的“自媒体时刻”与裁员必然性 * 观点:AI 极大地降低了“智力供应的成本”,这是一个不可逆的事实。 * 类比:现在的程序员面临的冲击,就像 20 年前传统媒体人面对“自媒体”的冲击一样。 * 预测:随着 AI Coding Agent(如 Claude Code 等)的成熟,大量基础代码工作将被替代,原本高门槛、高逻辑性的工作会变得普及化,裁员和职业转型是技术发展的必然结果。 4. 应对之道:Just for fun * 在这个剧变的时代,如何不走弯路?张笑宇建议抛弃沉重的“思想包袱”(那些由于技术范式转移而变成垃圾的旧知识)。 * 心态:像爱因斯坦发明灯泡时那样,不是为了成功而痛苦坚持,而是享受每一次尝试的快乐。保持 "Just for fun" 的状态,才最接近“涌现”的本质,也是离顶尖人才最近的状态。
DeepSeek开源连击、Claude编码升级、GPT性能迷局,系统解读大模型诸神之战 | 万有引力AI 大模型正在经历“神仙打架”时刻。 从开源技术到商业竞争,从性能突破到成本争议,甚至引发了一场“血案”!本期《万有引力》,我们将从技术、商业到未来趋势,带大家系统解读这场“诸神之战”,解读眼花缭乱的热点事件背后,真正值得大家关注的点。(本期节目于 3 月 4 日晚在 CSDN 视频号直播。) 嘉宾: 刘广,智源人工智能研究院数据研究组负责人 肖涵,Jina AI 创始人及 CEO 唐小引,CSDN&《新程序员》执行总编、《万有引力》主理人 我按照时间线和关键点进行了梳理: 首先是,DeepSeek 开源周所开源的项目,几乎是将自己核心的 AI Infra 技术都公布了出来: 可以总结归类为: 计算:FlashMLA、DeepGEMM,算力加速与硬件优化; 通信:DeepEP、DualPipe、EPLB,通信优化与并行计算; 存储:3FS、Smallpond,存储与数据处理。 这技术维度的开源五连发,DeepSeek 为什么要这么做,他们的真实意图是什么,从行业、AI 从业者、开发者这几个维度,分别会带来哪些影响? DeepSeek 的 One More Thing:DeepSeek 官方披露了如何通过优化架构,让模型推理获得更大的吞吐和更低的延迟;以及大规模部署成本和收益,测算了在这种优化架构下,按照目前的收费策略,一天能赚多少钱——颠覆了很多人的认知。这留给我们的启示是什么?DeepSeek 公布模型推理成本利润细节,将会带来哪些影响(API 要降价?MoE 成必选)? 2 月 18 日,马斯克的 Grok 3:使用 20 万张 GPU(豪横),在数学、科学和编码基准测试中,击败了 Google Gemini、DeepSeek V3、Claude 以及 OpenAI 的 GPT-4o。于是就有声音说 Scaling Law 依然成立,还是要大力出奇迹。 但十天之后,2 月 28 日凌晨,OpenAI 正式发布了其迄今为止规模最大的 AI 模型——GPT-4.5(代号 Orion)。尽管 OpenAI 表示 GPT-4.5 是该公司有史以来算力和数据规模最大的模型,但这次的性能提升并未像此前 GPT 系列一样带来革命性的飞跃。不仅如此,GPT-4.5 高昂的运行成本和在一些关键基准测试上的表现差强人意,于是又让大家开始怀疑——AI 长期依赖的 Scaling Law,正在走向终点了吗? 2 月 18 日,DeepSeek 团队发布新型注意力机制 NSA,梁文锋署名。和 DeepSeek 发表 NSA 论文同期,Kimi 发布论文 MoBA,MoBA 将 MoE(专家混合)应用于注意力机制,通过遵循一种“less structure” 原则,允许模型自主决定关注哪些区域或位置。最终结果是,在保持模型性能不变的前提下,将处理 1M 和 10M 长文本的速度分别提升了 6.5 倍和 16 倍。而且按照论文得出的结论:MoBA 开箱即用,它能轻松融入现有模型,无需高昂训练成本。 都是集中在稀疏注意力机制上。此前 MiniMax 发表了线性注意力机制的论文。 2 月 25 日,Anthropic 重磅发布首个混合推理模型——Claude 3.7 Sonnet。这个模型在编码和前端 Web 开发方面表现突出,用户既可以让模型给出实时答案,也可以给出经过深思熟虑的答案。Perplexity Pro、Cursor、Windsurf 等各个工具与平台都第一时间上线。 “源神”DeepSeek、克制的 Claude、豪横的 Grok 与 GPT,谁更值得关注?有没有很重要但是被大家忽视的?GPT-4.5 被低估了吗?现在还有什么被大家低估或者应该重视的模型、技术? 一起来听本期节目的讨论~ BGM:《代码星辰》By DeepSeek+Suno 关于《万有引力》: 这是由 CSDN&《新程序员》执行总编唐小引主理的对话栏目。技术趋势多变,一不留神总担心错过。正在发生的技术事件,对于我们开发者意味着什么?我们面临的诸多困惑从何寻找答案?《万有引力》即志在于此,直面事件与困惑,抽丝剥茧,解读技术真相。 栏目定位:一档面向开发者群体,聚焦解读技术事件的对话直播栏目。 直播观看平台:CSDN 视频号、CSDN 网站&App 多形式:文章、视频、音频都会有,持续关注 CSDN 公众号都可获取。目前《万有引力》栏目已上线小宇宙平台,欢迎大家关注!
DeepSeek的意义堪比OpenAI发布ChatGPT,未来半年复现DeepSeek会成为主要目标 | 万有引力朋友们,《万有引力》上新啦~一起来聊聊 DeepSeek 对 AI 技术及开发者的刷新。 从 DeepSeek 爆火至今,我们能够看到一些大佬关于 DeepSeek 的言论: * 马斯克对于 DeepSeek R1 是否是 AI 领域的一次彻底革命这个问题,很明确地说了「不是」,并表示,“xAI 和其他一些公司很快就会发布比 DeepSeek 更好的模型”。 * 谷歌 DeepMind 首席执行官 Demis Hassabis:DeepSeek 的 AI 模型可能是“我见过的来自中国最好的作品”。但他认为从技术角度来看,模型并未带来新的科学进展,而是使用了已知的技术,外界对其炒作可能“有点夸张”。 * Anthropic(开发 Claude 模型的公司)CEO Dario Amodei 之前发布了篇“万字长文”,说:DeepSeek-V3 并不构成根本性突破或创新,DeepSeek-R1 的研究价值甚至连 V3 都不如。 这其实核心讨论的是 DeepSeek 技术创新的问题。其实我们能够看到,当大家都烧钱堆算力,DeepSeek 却选择了烧脑改算法。比如: * 强化学习:DeepSeek 靠着纯强化学习,找到了激发模型推理能力的秘诀,还把模型的思考过程直接展现给了所有的用户。 * 在 Transformer 架构的基础上,使用 MoE(混合专家模型)、MLA(多头潜在注意力)。 而对于离 AI 最近的程序员来说,一方面,模型的代码能力依然在突飞猛进,从最开始因其局限性令人嗤之以鼻,但现在能力越来越强了;另一方面,Sam Altman、扎克伯格都说过,未来 AI Agent 能够完成大部分经验 3 - 5 年的软件工程师。怎么看待和处理 AI 与程序员之间的关系?当 AI 变得越来越“像人” 的时候,我们是否应该反思人类智能的独特性和价值? 所以这一期里,我特别引用了「刷新」这个词,和大家一起深入聊聊 DeepSeek 对 AI 技术、对开发者的刷新。 嘉宾: 崔淦渠,上海人工智能实验室青年科学家 吕仲琪,中国石油大学(北京)副教授、人工智能学院计算机系系主任 唐小引,CSDN&《新程序员》执行总编、《万有引力》主理人 本期节目于元宵节晚上在 CSDN 视频号直播,有一万多位朋友线上参与了这场直播与互动,也是别样的记忆。特此 BGM《代码赠予我的》送给大家,AI 唱的离空灵的王菲差了十万八千里哈哈。 时间戳: 01:38 AI 学术圈怎么看 DeepSeek 的创新 06:24 如何看待马斯克、DeepMind、Anthropic 质疑 DeepSeek 的言论 08:35 DeepSeek 的意义比肩 OpenAI 发布 ChatGPT,未来半年复现 DeepSeek 会成为圈内主要目标 14:33 推理圈的清流:详细拆解 DeepSeek 开发的强化学习新“杀手锏”—— GRPO 算法 24:59 为什么强化学习是下一个 Scaling Law? 50:10 强化学习也不是万能的,对于推理能力我们还有更好的方案吗? 1:00:28 揭秘 DeepSeek 内幕:步步为营,DeepSeek 是如何逐步炼成的 1:05:16 从梁文锋的论文署名可窥 DeepSeek 的投入重点方向 1:06:41 大模型历史,DeepSeek R1-Zero 必有一笔 1:07:52 热点解读:为什么苹果国行版 AI 没有选择 DeepSeek? 1:14:48 DeepSeek 启示:长期主义探索与技术的极致 1:18:22 压力给到所有大模型从业者:DeepSeek 引发的鲶鱼效应 1:24:26 MoE 不适合小模型,优势在于超大模型 1:29:22 高校老师有话说:如果完全用大模型,人类的竞争力在哪里?论文大量使用 AI 属于学术不端? 1:35:47 程序员革了自己的命?重新思考 AI 与程序员的关系 1:42:07 提示工程没有终结 2:00:06 BGM《代码赠予我的》By AI,欢迎收听。 关于《万有引力》: 这是由 CSDN&《新程序员》执行总编唐小引主理的对话栏目。技术趋势多变,一不留神总担心错过。正在发生的技术事件,对于我们开发者意味着什么?我们面临的诸多困惑从何寻找答案?《万有引力》即志在于此,直面事件与困惑,抽丝剥茧,解读技术真相。 栏目定位:一档面向开发者群体,聚焦解读技术事件的对话直播栏目。 直播观看平台:CSDN 视频号、CSDN 网站&App 多形式:文章、视频、音频都会有,持续关注 CSDN 公众号都可获取。目前《万有引力》栏目已上线小宇宙平台,欢迎朋友们关注~
直击 DeepSeek 技术真相,对我们究竟意味着什么?| 万有引力Hello 大家好,我是小引,《万有引力》上新啦,这一期内容是我们「DeepSeek 暨 AI 进化论十日谈」系列的其中一期。和大家深入聊一聊《直击 DeepSeek 技术真相,对我们究竟意味着什么?》。 为什么会设这样一个主题,出发点主要有这样几个方面: 首先,DeepSeek 的各种消息满天飞,我们能够看到各种碎片化,或者相当标题党的信息,其中有真有假。 DeepSeek 在硅谷引发了很大的效应,比如大家能看到,Sam Altman/图灵奖得主 杨立昆等各大佬都在讨论,微软/亚马逊/英伟达/英特尔,还有国内的各个企业,耳熟能详的,都宣布搭载或支持了 DeepSeek,这种效应很有开天辟地第一朝的即视感。 DeepSeek-V3 刚刚出来的时候,在技术圈大家讨论其实就很多,因为当时算力成本有六百多万美元,已经大幅降低,当时许多 AI 专家就在讨论,算力不再是决定模型质量的唯一因素。当时我跟一些朋友聊,就在猜测 DeepSeek 的成本应该还能再进一步降低。紧接着,R1 就来了,以极强的破圈效应,人人都在讨论,人人都在使用。 所以在这场对话中,我们会聚焦在技术突破、行业影响、开发者机遇三大维度,邀请到了硅谷、学术、产业的三位老师,一起抽丝剥茧,还原这场席卷全球的 AI 风暴背后的真相,拆解对于我们所有开发者来说需要关注的关键点。 嘉宾: 吴双,硅谷资深 AI 技术专家 刘伟,北京邮电大学人机交互与认知工程实验室主任 王文广,资深大模型专家,《知识增强大模型》(即将出版)作者、前达观数据副总裁 唐小引,CSDN&《新程序员》执行总编、《万有引力》主理人 同时在这期播客里,我用 DeepSeek 生成了《AI 战神》的歌词,并用 MakeBestMusic 把它制作成了音乐,我听了还挺好听,在这里作为 BGM 分享给大家。进度条最后可以收听完整版。 Timeline: 06:30 DeepSeek 之热:中国式的全球化、硅谷观察 30:50 DeepSeek 的技术创新:V3 是工程优化的胜利,R1 是科研的突破 42:13 复刻 DeepSeek:(1)DS 梁文锋的路子可复制吗?(2)解读李飞飞团队仅用不到 50 美元复刻 R1 模型 55:42 谈蒸馏技术:DeepSeek 蒸馏争议无需关注 1:04:05 DeepSeek 没有绕开 NVIDIA CUDA 的依赖 1:07:53 谈 DeepSeek 是开源的胜利 1:20:10 评 OpenAI 的 Deep Research 及 Google 的 Gemini 2.0 全家桶 1:25:51 DeepSeek 的席卷让云、算力厂商、AI Infra 企业都很兴奋,但为何模型厂商们纷纷缄默? 1:26:37 DeepSeek 之后,模型技术演进在何方? 1:32:39 对开发者的启示:DeepSeek 的爆发对开发者、开发者的技术栈有何影响?是否需要转型?未来开发者的方向在哪里? 1:59:15 BGM 收听:《AI 战神》 关于《万有引力》: 这是由 CSDN&《新程序员》执行总编唐小引主理的对话栏目。技术趋势多变,一不留神总担心错过。正在发生的技术事件,对于我们开发者意味着什么?我们面临的诸多困惑从何寻找答案?《万有引力》即志在于此,直面事件与困惑,抽丝剥茧,解读技术真相。 直播观看平台:CSDN 视频号、CSDN 网站&App 多形式:文章、视频、音频都会有,持续关注 CSDN 公众号都可获取,欢迎朋友们持续关注!
对话玉伯、汪源:Agent 的出现会打破大家对 AGI 的执念 | 万有引力过去一年,AI 不仅颠覆了传统软件开发范式,更深刻地改变着每个人的工作方式。当我们习惯了 AI 帮我们写代码、生成内容、规划日程,却也开始思考产品形态、数据隐私、创作方式等根本性问题:为什么感觉被推荐算法“喂养”的时间越来越多?AI 让工作效率提升了,但创造力是否在减弱?我们需要把所有工作数据和个人数据都交给团队协作平台吗?大语言模型真的能理解复杂的业务需求吗?未来工作模式的转变已在眼前,但方向仍扑朔迷离。 2025 年 1 月 20 日,CSDN 对话直播栏目《万有引力》迎来第三期。在栏目主理人 CSDN &《新程序员》执行总编唐小引的主持下,思维天空创始人、语雀创始人玉伯,久痕科技创始人、CEO、前网易副总裁汪源围绕这些问题展开深入对话,分享了多个引发热议的观点。 玉伯: * 从农村到一线城市已形成共识:少刷抖音。人应主动创作而非被动消费,创作将成为新的消费方式,能带来更深层的满足感。年轻用户已经不再满足于被动接受内容“喂养”。这类纯消费型产品可能会逐渐被淘汰,取而代之的是能让用户既是消费者又是创作者的平台。 * Agent 的出现会打破大家对 AGI 的执念。现在聊的 AGI 还停留在博物学家的概念,因为知识量不大,所以可以什么都懂。但在当今知识大爆炸、高度专业化的时代,这种大一统是不存在的。这就是一种祛魅——认识到所谓的 AGI 只是人类的一个执念。 * 技术创业者要跳出技术思维。虽然容易理解 AI 边界、能快速试错,但也容易因懂技术而低估产品价值。 * 所谓的 AIGC、AI、Agent、AI Native 这些都是在造概念。这些概念背后可能有一些意义,但本质上都是基于现有的大语言模型去开发功能,叫什么名字并不重要。就像回到移动互联网时代,我们也不会去纠结微信是太极式还是武当式,这些都不重要。 * 移动互联网时代靠人口红利才能实现“先做规模再做营收”,但 AI 时代已经不再有真实的人口红利了,所以千万不要用当年的思路去做产品。 汪源: * 所有数据都应归属个人。把日常工作记录放在协作平台上是危险的,个人数据必须保持私密,只有经过加工的内容才适合共享。 * 未来属于复杂脑力劳动者。简单的职能工作会被自动化取代,程序员要向全能型人才发展,产品和技术两手抓。 * 面向个人是 AI 时代新机遇。与传统 SaaS 和云架构不同,面向个人、本地优先将成为新趋势,但成本控制是关键挑战。 * 仅仅调用大模型 API 并不能解决所有问题,这就像游戏开发一样。即便所有游戏公司都在使用 Unity 这样的通用引擎,最终做出的游戏依然千差万别。用第三方大模型开发 AIGC 产品,真正的差异在于你如何运用这个工具。 * AI 工具最终应该按照它给用户提供的价值和效果来收费,而不是像 SaaS 时代那样按照坐席订阅。随着 AI 应用对用户价值的增加,它可能会达到每月 100 多美元的层次。
对话张海龙、宝玉、陈鑫、郑勤锴:通用的 Coding Agent 是做不出来的、AI 让 35 岁程序员的春天来了!想知道 2025 年 AI 编程会发生哪些颠覆性的改变?对程序员们的影响是怎样的?本期《万有引力》邀请到多位深耕 AI 编程领域的技术专家,包括: 张海龙,Gru.ai CEO、CODING 创始人、硅谷创业者 宝玉,Prompt Engineer、资深 AI 编程博主 陈鑫,阿里云通义灵码技术负责人 郑勤锴,智谱 AI CodeGeeX 团队技术负责人 唐小引,CSDN&《新程序员》执行总编、《万有引力》主理人 一起围绕《2025 年,AI Coding 将如何演进?》展开对话,深入探讨从 Copilot 到 Agent、从多文件生成到企业级落地,以及测试、Debug、Code Review 等关键场景下的实战经验。 你将了解到: * 业界对 AI 编程最新趋势的真实看法 * 大模型与 IDE 结合时的潜能与局限 * 如何做好提示词工程,提升生成代码的质量 * AI 在编程效率与架构设计中扮演的新角色 * Agent 是否能真正成为“全能实习生”,帮你扫清软件开发中的各种“脏活累活” 本期还将深入讨论 AI 编程时代下的程序员前景:如何把握机会,摆脱“35 岁危机”,以及如何在团队中成功推动 AI 工具的使用。快来获取最前沿的 AI 编程洞察,为你的软件开发之路注入全新动能! 时间轴: 03:25 AI 编程发展总结:Copilot、Cursor、Agent 谁领风骚? 20:23 通用的 Coding Agent 是做不出来的? 33:04 企业级视角:大型项目 AI 落地的痛点与可能性 38:29 提示词工程&上下文:如何精准描述需求? 48:27 让 AI 理解需求是个伪需求? 52:57 代码质量与性能:如何避免生成“垃圾代码”? 59:11 测试是 AI 最容易直接胜任的领域? 1:01:36 Code Review 是最难做的环节,也是人类程序员最大的价值之一 1:13:07 跨文件跨工程能力:多文件修改的极限在哪? 1:28:12 AI 与程序员:被替代 or 被赋能?35 岁危机再思考 1:37:19 2025 年 AI 编程里程碑:Agent 还能走多远? 1:41:54 观众 Q&A:Copilot vs Agent,如何提升安全性、隐私与落地方案 1:52:04 结语:拥抱 AI 编程的时代红利,从现在开始! 如果觉得本期干货满满,记得点个赞并分享给更多小伙伴,一起踏上 AI 编程的崭新征程! 关于《万有引力》: 这是由 CSDN&《新程序员》执行总编唐小引主理的对话栏目。技术趋势多变,一不留神总担心错过。正在发生的技术事件,对于我们开发者意味着什么?我们面临的诸多困惑从何寻找答案?《万有引力》即志在于此,直面事件与困惑,抽丝剥茧,解读技术真相。 直播观看平台:CSDN 视频号、CSDN 网站&App。 多形式:文章、视频、音频都会有,持续关注 CSDN 公众号都可获取,欢迎朋友们持续关注!
“纯”大模型公司不复存在、产品经理将比程序员更重要?林咏华、黄东旭、李建忠激辩大模型 | 万有引力人间一年,大模型三年。 2024 年春节尚未结束之时,Sora 横空出世,由此拉开了大模型多模态大战的序幕。 大模型的幻觉问题,从苦寻消除良方变成了接纳,RAG 技术由此风靡,将传统的生成式大模型与实时信息检索技术相结合成为了王道,所有大模型研发必有 RAG。 与之相对应的是摒弃预训练、微调之风渐起,OpenAI 前首席科学家 Ilya Sutskever 直言“预训练即将终结(Pre-training as we know it will end)”。 开源 vs 闭源之争不绝于耳,和以往传统开源不同,依赖于代码、数据集、训练的大模型什么时候能够 360° 完全透明地开源成为了开发者们渴求的开源姿势。 2024 年,我们呼唤着大模型杀手级应用的到来,但依然未能如愿。GenAI 应用爆发何时到来、生成式 AI 应用究竟该怎么做?困惑良多。 值此年关交替之际,CSDN、《新程序员》出品的对话栏目《万有引力》特别组织了《2025 年,大模型会有哪些新变化?》专题对话,邀请到: 林咏华,北京智源人工智能研究院副院长兼总工程师 黄东旭,PingCAP 联合创始人兼 CTO 李建忠,CSDN 高级副总裁 唐小引,CSDN&《新程序员》执行总编、《万有引力》主理人 一起深入讨论: 05:15 2024 年度,大模型技术的关键命题 21:40 激辩:相不相信 Scaling Law?相信什么样的 Scaling Law? 40:12 AI 技术的全球、国内战场观察 51:54 不要再搞从 0 到 1 的大模型创业了! 55:02 产品经理 vs 程序员:AI 时代谁更重要? 1:04:03 模型训练,数据质量>算力? 1:12:35 RAG 技术是“权宜之计”还是最终方案? 1:18:37 多模态进展不足:移动互联网时代“不同模态发展路径”值得借鉴 1:27:55 推理元年,Agent 为什么没有落地? 1:34:53 大模型开源和闭源之间,还差最后几公里? 1:40:52 2025 的关键在于具身智能? 【直播预告🎉】 1 月 15 日中午 12:00,《万有引力》特别邀请到 Gru.ai CEO、CODING 创始人 张海龙,Prompt Engineer、知名 AI 博主 宝玉,阿里云通义灵码技术负责人 陈鑫、智谱 AI CodeGeeX 团队技术负责人 郑勤锴,一起深入聊聊程序员朋友们最关心的 AI Coding 的痛点及演进,欢迎大家点击链接或扫描下方二维码参与和交流。 关于《万有引力》: 这是由 CSDN&《新程序员》执行总编唐小引主理的对话栏目,技术趋势多变,一不留神总担心错过。正在发生的技术事件,对于我们开发者意味着什么?我们面临的诸多困惑从何寻找答案?《万有引力》即志在于此,直面事件与困惑,抽丝剥茧,解读技术真相。 直播观看平台:CSDN 视频号、CSDN 网站&App。 多形式:文章、视频、音频都会有,持续关注 CSDN 公众号都可获取,欢迎朋友们持续关注。