31. 中美大模型差距过去一年变大还是缩小？- Hugging Face | 王铁震

苔藓之火

66分钟 ·2个月前

37054

127

也许14亿人的数据飞轮会成为下一轮大战的燃料储备，推荐算法也不是字节开始的，但抖音才是集大成者。

完整无删节版本请看视频播客 ▶️YouTube链接

嘉宾：前Hugging Face APAC Ecosystem Head | 王铁震 Linkedin联络方式

免责申明：本节目的所有内容都并非旨在提供任何形式的建议，包括但不限于投资、税收、会计或法律上的任何建议。

互动环节：

1）参与投票，你觉得未来一年差距变大还是缩小？

2）你使用AI有什么想吐槽的？

Shownotes:

01:50 为什么用脚投票，体感上美国模型还是远远领先？

03:30 中国大模型跨过可用这条线吗？

07:16 从惊艳到理所当然，用户的衰减曲线有多快？

09:28 DeepSeek V4发布，为什么没像年初那样炸裂？

10:17 被忽视的实力：DeepSeek如何通过KV Cache把成本打到地板？

13:20 适配国产卡，为何是世界级难题？

17:15 美国怎么看中国模型？

21:38 中国模型爱刷榜？

29:19 数据壁垒越来越高，中美模型差距会因此越拉越大吗？

30:40 14亿人的数据飞轮会带来什么？（致歉：录制中间出现口误说了12亿几次）

35:24 HuggingFace热知识：中国模型的全球下载量被低估

36:49 美国人用中国开源模型的三个阶段：抗拒、接受、离不开

41:15 Mistral在欧洲还好吗？

43:05 2026年，疯狂开源的浪潮会退去？赚钱才是硬道理

45:27 哈萨比斯说中国差在心态，是傲慢还是事实？

50:30 如何考虑AI的效用与向善

59:16 AI能自己迭代自己，一个新物种正在诞生吗？

01:02:39 AI时代怎样养小孩？

关键词

中美大模型差距 DeepSeek 数据飞轮开源闭源千问 Claude 豆包算力封锁国产卡 KV Cache 数据飞轮刷榜 AI伦理养娃

展开Show Notes

投票

2026.5.12

这么好的播客才一万

nico_:有内容但呈现不好啊

0xRaymond

:因为伯乐不常有

共8条回复

AaronZ_RprY

2026.5.15

42:42 所以主持人是完全不懂技术是吗…

MC43:说不知道T是多大的时候，我愣了一下

0xRaymond

:哎哟哎哟，我可不是很喜欢你这句话，我现在可是claude max会员，所以我就是CTO级别的技术高手了哈哈

共5条回复

Geisterfahre

2026.5.16

好用的是claude code的前端。在claude code上用kimi和deepseek，会比直接用kimi和deepseek好用很多。所以主观上模型的差距并不大，而是背后的prompt，架构上的优化方面，claude code非常强。

川陀农民工:深有同感！我同样用 glm，任务书一样，用 opencode 接入和用 Claude Code 接入，产出的效果是明显不同的

王白水:claude code做了很多优化，之前失误开源，有很多人分析源码了

HD667885y

2026.5.14

朴实无华，我也觉得一旦中国大模型抵达opus4.6的可用程度，就能翻盘一切了。这个能力和高可用性能做太多事情。

0xRaymond

:我今天又觉得看法变了，因为就是其实我对于 Vibe Coding 的阈值也是越来越高的。之前 3.5 是可以用的，今天看 4.6 也是刚刚好够。可能一年之后，我觉得 Opus 5.5 我也不能接受了。所以这个确实是水涨船高，我也不确定。

生而为猫奴:但是普通消费者和国内小企业还是很价格敏感的。看看国内大模型和云公司今年收入涨幅就是了，我觉得智能阈值是相对的

共3条回复

HD500838v

2026.5.13

反复尝鲜者表示codex＞claude＞kimi2.6＞deepseek＞glm＞＞minimax

JimmyLau:首先codex不是模型

三明治拌面:agent 和大模型不是同一个东西

共9条回复

JZB

2026.5.16

DS的低成本才是未来，只要后续跨过可用线就赢了

Shoriscool

2026.5.14

感谢这个播客，很精彩！不仅仅是谈技术细节上的趋势，也照顾到了商业化，tech for good，but如今的ai在产业界变成了裁员的工具。与此同时从业者一个个的又十分焦虑。小到模型的发展大到社会的进步，我们每个人身处一场革命之中。到底谁会成为那个拿着ai这把锋利刀的人？ta会有良心吗？

lee123321

2026.5.14

主播说Codex不可用？你已经out了！

0xRaymond

:哈哈哈哈哈

白色的蓝

2026.5.12

这期很好， Raymond 问的问题很好，很犀利；嘉宾铁震行业和技术很扎实👍🏼

0xRaymond

:铁震已经是我明确的返场嘉宾了，说得超级好

Emilian

2026.5.14

首页推荐来的，意外是很好的内容，干货很多，没有废话，信息密度很好，主持人很会问问题。感觉大家用模型的方式都好高级，我现在还在使用对话框聊天的阶段（汗颜）

晨煊-

2026.5.12

张小珺播客最新一期嘉宾其实提到了圈内人大多心照不宣，国内的模型大多是靠蒸馏美国的，只不过通常“软蒸”属于灰色地带，也有其存在即合理之处，其他个别那些“硬蒸”的就纯属偷了，看评论，貌似那家已上市的公司就是“硬蒸”的。所以当宣传追上了，训练成本低时，都实际有另一个故事……

140. 对姚顺宇的4小时访谈：请允许我小疯一下！在Anthropic和Gemini训模型、技术预测、英雄主义已过去

暴走的鬼畜:14:15 本来a社很多灰色操作也没人告他啊，最开始是爬虫爬的盗版书网站，而且姚顺雨无数次暗示了a社扒了所有的历史的github的数据，不能这么双标吧.

陌生ZZx:都在互相蒸馏

共7条回复

肥虫子的Voyager2

2026.6.04

主持的非常好啊! 尤其是把技术背景设定在普通人能听懂的框架, 很多问题明显是为了大众能听懂做了铺垫的. 不懂评论区挑的都是什么刺儿…这世界就是这样, 评论都是两嘴一张就来…

王者丰饭:支持，专门提到可能有人不了解GitHub这一点，就说明博主很用心了

0xRaymond

:太温暖了，谢谢你🙏

时间里的飞人_ZfHs

2026.5.13

全程没有废话，全是干货！

小天狼星111

2026.5.16

嘉宾不错，有逻辑，有想法，三观正

不空_ZgUf

2026.5.16

我觉得大多数人还是不会用，模型要提供足够的上下文，做足够的评估，对自己的作业做好优化，才能用好，不能老想着一把过，这样会越用越累。

Dwight

2026.5.16

Huggingface的insider来作客的一期留言都不到99+，那平时号称在关注ai的旁友在听啥呀哈哈。

0xRaymond

:说的太好了！

泥舟

2026.5.13

27:28 数据飞轮这个概念真的成立吗？

xinbabay

2026.5.13

想听AI时代怎么养小孩的专场😁

0xRaymond

:马上就要来了

chen108:支持！

陌生ZZx

2026.5.13

大模型推理适配国产卡很简单，苹果macmini都能推理。真正是后训练这些地方考验国产卡

洛圣都出租车司机:你是不是分不清推理机和客户端呀

阿爆

2026.5.14

嘉宾离开hugging face后去创业了吗？

0xRaymond

:可以关注他的X

Luckyhazel:他的X账号什么，搜他名字没搜到

共4条回复

打开小宇宙查看更多精彩评论