Hello 大家好,我是小引,《万有引力》上新啦,这一期内容是我们「DeepSeek 暨 AI 进化论十日谈」系列的其中一期。和大家深入聊一聊《直击 DeepSeek 技术真相,对我们究竟意味着什么?》。
为什么会设这样一个主题,出发点主要有这样几个方面:
首先,DeepSeek 的各种消息满天飞,我们能够看到各种碎片化,或者相当标题党的信息,其中有真有假。
DeepSeek 在硅谷引发了很大的效应,比如大家能看到,Sam Altman/图灵奖得主 杨立昆等各大佬都在讨论,微软/亚马逊/英伟达/英特尔,还有国内的各个企业,耳熟能详的,都宣布搭载或支持了 DeepSeek,这种效应很有开天辟地第一朝的即视感。
DeepSeek-V3 刚刚出来的时候,在技术圈大家讨论其实就很多,因为当时算力成本有六百多万美元,已经大幅降低,当时许多 AI 专家就在讨论,算力不再是决定模型质量的唯一因素。当时我跟一些朋友聊,就在猜测 DeepSeek 的成本应该还能再进一步降低。紧接着,R1 就来了,以极强的破圈效应,人人都在讨论,人人都在使用。
所以在这场对话中,我们会聚焦在技术突破、行业影响、开发者机遇三大维度,邀请到了硅谷、学术、产业的三位老师,一起抽丝剥茧,还原这场席卷全球的 AI 风暴背后的真相,拆解对于我们所有开发者来说需要关注的关键点。

嘉宾:
吴双,硅谷资深 AI 技术专家
刘伟,北京邮电大学人机交互与认知工程实验室主任
王文广,资深大模型专家,《知识增强大模型》(即将出版)作者、前达观数据副总裁
唐小引,CSDN&《新程序员》执行总编、《万有引力》主理人
同时在这期播客里,我用 DeepSeek 生成了《AI 战神》的歌词,并用 MakeBestMusic 把它制作成了音乐,我听了还挺好听,在这里作为 BGM 分享给大家。进度条最后可以收听完整版。
Timeline:
06:30 DeepSeek 之热:中国式的全球化、硅谷观察
30:50 DeepSeek 的技术创新:V3 是工程优化的胜利,R1 是科研的突破
42:13 复刻 DeepSeek:(1)DS 梁文锋的路子可复制吗?(2)解读李飞飞团队仅用不到 50 美元复刻 R1 模型
55:42 谈蒸馏技术:DeepSeek 蒸馏争议无需关注
1:04:05 DeepSeek 没有绕开 NVIDIA CUDA 的依赖
1:07:53 谈 DeepSeek 是开源的胜利
1:20:10 评 OpenAI 的 Deep Research 及 Google 的 Gemini 2.0 全家桶
1:25:51 DeepSeek 的席卷让云、算力厂商、AI Infra 企业都很兴奋,但为何模型厂商们纷纷缄默?
1:26:37 DeepSeek 之后,模型技术演进在何方?
1:32:39 对开发者的启示:DeepSeek 的爆发对开发者、开发者的技术栈有何影响?是否需要转型?未来开发者的方向在哪里?
1:59:15 BGM 收听:《AI 战神》
关于《万有引力》:
这是由 CSDN&《新程序员》执行总编唐小引主理的对话栏目。技术趋势多变,一不留神总担心错过。正在发生的技术事件,对于我们开发者意味着什么?我们面临的诸多困惑从何寻找答案?《万有引力》即志在于此,直面事件与困惑,抽丝剥茧,解读技术真相。
直播观看平台:CSDN 视频号、CSDN 网站&App
多形式:文章、视频、音频都会有,持续关注 CSDN 公众号都可获取,欢迎朋友们持续关注!

