DeepSeek 开源周 | 全景解读与我们的思考,开源加速 AI 创新AI炼金术

DeepSeek 开源周 | 全景解读与我们的思考,开源加速 AI 创新

80分钟 ·
播放数3817
·
评论数7

大家好,欢迎来到新一期的AI炼金术。本期我们聊聊 DeepSeek 的开源周——从2月24日到3月1日,六天里他们带来了令人惊喜的技术发布。

DeepSeek这样的中国团队正在全球AI技术竞争中展现出强大的创新实力,通过开源战略不仅推动了AI领域的技术突破,还降低了开发门槛和成本,让全球AI社区能够共享技术成果并加速创新。

与此同时,"杭州七小龙"等创新集群正在崛起,宇树科技等新锐企业不断开拓疆土。阿里钉钉则凭借To B领域优势,将AI无缝融入日常办公场景,让用户真切感受到AI带来的效率提升。

这些中国力量的崛起,正在重塑全球AI产业格局,开源浪潮也在加速整个AI行业的竞争与洗牌,为各类应用开发者创造了前所未有的机会。让我们一起走进 DeepSeek 开源周的精彩内容。


时间线:

02:18 DeepSeek发布会Day 1:FlashMLA 大幅提升GPU的内存带宽和计算性能

17:07 DeepSeek发布会Day 2:DeepEP 专家并行(EP)通信库,降低模型推理延迟

23:00 DeepSeek开源策略及其对生态的影响

28:16 阿里:AI模型竞争下,规模和场景成为护城河

33:34 钉钉:AI在日常办公的应用潜力

39:14 DeepSeek发布会Day 3:DeepGEMM 大模型计算优化矩阵乘法库,提高计算效率

47:09 DeepSeek发布会Day 4:DualPipe 优化流水线并行策略,提升模型训练和推理效率

55:57 DeepSeek发布会Day 5:EPLB 专家负载均衡器,提升模型性能

1:01:02 DeepSeek发布会Day 6:DeepSeek-V3/R1 专家咨询(EP)增大batch size、隐藏通信延迟、执行负载均衡,提高推理吞吐量和更低延迟

1:12:14 DeepSeek开源战略对AI行业的影响

*提醒:本期涉及观点不构成任何投资建议,投资需谨慎。


欢迎订阅「AI 炼金术」的播客,以及同名公众号、视频号 

「AI 炼金术」是一档由徐文浩和任鑫——两位多年老友、AI 领域的资深从业者——打造的播客。这里是探讨 AI 和创业的理想聚集地,我们会邀请一线创业者、产品产品和科研学者,深入探讨 AI 如何重塑行业、变革生活,以及如何从 0 到 1 打造 AI 原生产品。 我们的讨论会涵盖多个话题:从 AI 如何改变世界的未来,到如何找到 AI 创业的 PMF;从如何利用 AI 降本增效,到怎样将 AI 技术融入日常生活……如果你对 AI、产品、创业感兴趣,这里有满满的干货和一线实战经验,欢迎关注并推荐给你的朋友,共同探索未来的无限可能!


商务合作:公众号 「AI炼金术 」菜单栏中【商务】获取联系方式


节目主理人:

徐文浩:某AI创业公司联合创始人,正在面向全球市场开发AI应用。连续创业者,参与过多家创业公司,拼多多早期员工。广告科技公司MediaV的算法和数据负责人,后被360收购。离开后加入成立不到1个月的拼多多。后创办了基于AI的海外客服聊天机器人公司BotHub. AI和 海外社交电商平台 Bukito 都宣告失败。2023年再次下场创业。


任鑫:云九资本合伙人,主要在投资和孵化面向全球市场的 AI 应用。之前是连续创业者,曾经打造“今夜酒店特价”用移动互联网应用特价销售酒店尾房;被京东并购后内部创业“京东到家”开展本地即时零售业务;2015 年再次创业 Get 探索对话式人工智能助理成为先烈;2021 年出售公司,2023 年重新回到 AI 世界。


BGM:

片头:Shortwire - Reconfig

片尾:Forester - The Flood



展开Show Notes
35:56 听脑放那一期,宇树没有什么具身智能的研究,他们的机器人也就是电机传感器这些比较强,每个动作都要重新编程的
晨萱-语迟者说:对,这些年国内这些科技进步都是虚妄,因为国运需要。从第一性原理角度讲,首先中美对抗,我们从官方到民间都要在制度,经济,文化,科技各个方面找出闪光点,并且放大之,哪吒 2 破百亿就是一个操作,deep seek,士农工商都要部署一套,也是这个原因。近几天媒体上遍布 Manus 的宣传,连关系不大的国内证券公司都写报告,领头在吹,创始人肖弘刚上了腾讯张小珺的播客,创始人说真格先投资了他做的 AI 浏览器插件 Monica ,大获成功,然后把投资赚的钱全部投了 Manus。从那播客中,听出创始人有极高市场敏锐度,擅长比别人更早发现机会,以及市场运营,技术不是他强项。所以 Monica 是套壳里面最赚钱,商业最成功的,但是附着在大模型上没有核心技术的。可以在大模型平台介入 agent 前赚一笔很大的快钱,但未必技术强,也未必比大厂懂业务协作流程。这些互联网,软硬件,AI 所有的明星项目都被自身或者第三方人为夸大了
生而为猫奴:冷静👍
心怡_Kiav
心怡_Kiav
2025.3.08
需要记笔记的一期,棒
这期内容很赞👍🏻
ll_3ZN1
ll_3ZN1
2025.3.13
05:15 还好这是在闲聊,如果是面试, 你要说attention layer消耗最多的算力, 那我直接reject不用进入下一轮了。。。。
忘了哪一出提到数据开源?这是常识,那个训练的数据集是不能开源的,会死无葬身之地的。没人可以开源而不会被告侵权,或者造成失控的社会风险