31. 中美大模型差距过去一年变大还是缩小?- Hugging Face | 王铁震苔藓之火

31. 中美大模型差距过去一年变大还是缩小?- Hugging Face | 王铁震

66分钟 ·
播放数29434
·
评论数109

也许14亿人的数据飞轮会成为下一轮大战的燃料储备,推荐算法也不是字节开始的,但抖音才是集大成者。

视频播客 📺B站链接 / 📕小红书链接 / ▶️YouTube链接(逐字稿在小红书)

嘉宾:前Hugging Face APAC Ecosystem Head | 王铁震 Linkedin联络方式

免责申明:本节目的所有内容都并非旨在提供任何形式的建议,包括但不限于投资、税收、会计或法律上的任何建议。

互动环节:

1)参与投票,你觉得未来一年差距变大还是缩小?

2)你使用AI有什么想吐槽的?

Shownotes:

01:50 为什么用脚投票,体感上美国模型还是远远领先?

03:30 中国大模型跨过可用这条线吗?

07:16 从惊艳到理所当然,用户的衰减曲线有多快?

09:28 DeepSeek V4发布,为什么没像年初那样炸裂?

10:17 被忽视的实力:DeepSeek如何通过KV Cache把成本打到地板?

13:20 适配国产卡,为何是世界级难题?

17:15 美国怎么看中国模型?

21:38 中国模型爱刷榜?

29:19 数据壁垒越来越高,中美模型差距会因此越拉越大吗?

30:40 14亿人的数据飞轮会带来什么?(致歉:录制中间出现口误说了12亿几次)

35:24 HuggingFace热知识:中国模型的全球下载量被低估

36:49 美国人用中国开源模型的三个阶段:抗拒、接受、离不开

41:15 Mistral在欧洲还好吗?

43:05 2026年,疯狂开源的浪潮会退去?赚钱才是硬道理

45:27 哈萨比斯说中国差在心态,是傲慢还是事实?

50:30 如何考虑AI的效用与向善

59:16 AI能自己迭代自己,一个新物种正在诞生吗?

01:02:39 AI时代怎样养小孩?

关键词

中美大模型 差距 DeepSeek 数据飞轮 开源 闭源 千问 Claude 豆包 算力封锁 国产卡 KV Cache 数据飞轮 刷榜 AI伦理 养娃

展开Show Notes
投票
已结束
47人参与
中美大模型的差距在未来一年变大还是缩小?
看结果
史地文
史地文
10天前
这么好的播客才一万
nico_:有内容但呈现不好啊
0xRaymond
:
因为伯乐不常有
8条回复
好用的是claude code的前端。 在claude code上用kimi和deepseek,会比直接用kimi和deepseek好用很多。 所以主观上模型的差距并不大,而是背后的prompt,架构上的优化方面,claude code非常强。
川陀农民工:深有同感!我同样用 glm,任务书一样,用 opencode 接入和用 Claude Code 接入,产出的效果是明显不同的
42:42 所以主持人是完全不懂技术是吗…
MC43:说不知道T是多大的时候,我愣了一下
0xRaymond
:
哎哟哎哟,我可不是很喜欢你这句话,我现在可是claude max会员,所以我就是CTO级别的技术高手了哈哈
5条回复
感觉主持人自己话有点过多了。建议主持人以后自己少说点,多一点有价值的问题。
HD667885y
HD667885y
7天前
朴实无华,我也觉得一旦中国大模型抵达opus4.6的可用程度,就能翻盘一切了。这个能力和高可用性能做太多事情。
0xRaymond
:
我今天又觉得看法变了,因为就是其实我对于 Vibe Coding 的阈值也是越来越高的。之前 3.5 是可以用的,今天看 4.6 也是刚刚好够。可能一年之后,我觉得 Opus 5.5 我也不能接受了。所以这个确实是水涨船高,我也不确定。
生而为猫奴:但是普通消费者和国内小企业还是很价格敏感的。看看国内大模型和云公司今年收入涨幅就是了,我觉得智能阈值是相对的
3条回复
HD500838v
HD500838v
8天前
反复尝鲜者表示codex>claude>kimi2.6>deepseek>glm>>minimax
JimmyLau:首先codex不是模型
三明治拌面:agent 和大模型不是同一个东西
6条回复
感谢这个播客,很精彩!不仅仅是谈技术细节上的趋势,也照顾到了商业化,tech for good,but如今的ai在产业界变成了裁员的工具。与此同时从业者一个个的又十分焦虑。小到模型的发展大到社会的进步,我们每个人身处一场革命之中。到底谁会成为那个拿着ai这把锋利刀的人?ta会有良心吗?
JZB
JZB
6天前
DS的低成本才是未来,只要后续跨过可用线就赢了
Emilian
Emilian
8天前
首页推荐来的,意外是很好的内容,干货很多,没有废话,信息密度很好,主持人很会问问题。感觉大家用模型的方式都好高级,我现在还在使用对话框聊天的阶段(汗颜)
这期很好, Raymond 问的问题很好,很犀利;嘉宾铁震行业和技术很扎实👍🏼
0xRaymond
:
铁震已经是我明确的返场嘉宾了,说得超级好
晨煊-
晨煊-
10天前
张小珺播客最新一期嘉宾其实提到了圈内人大多心照不宣,国内的模型大多是靠蒸馏美国的,只不过通常“软蒸”属于灰色地带,也有其存在即合理之处,其他个别那些“硬蒸”的就纯属偷了,看评论,貌似那家已上市的公司就是“硬蒸”的。所以当宣传追上了,训练成本低时,都实际有另一个故事……140. 对姚顺宇的4小时访谈:请允许我小疯一下!在Anthropic和Gemini训模型、技术预测、英雄主义已过去
暴走的鬼畜:14:15 本来a社很多灰色操作也没人告他啊,最开始是爬虫爬的盗版书网站,而且姚顺雨无数次暗示了a社扒了所有的历史的github的数据,不能这么双标吧.
陌生ZZx:都在互相蒸馏
6条回复
JimJin
JimJin
3天前
主页推送,嘉宾很赞,主持人如果技术不是很懂,希望对技术多些敬畏之心
leom_dGYL:嘉宾完全没问题,主持人真的是。。。打了一些字都删掉了
0xRaymond
:
别删,都打出来啊
lee123321
lee123321
7天前
主播说Codex不可用?你已经out了!
0xRaymond
:
哈哈哈哈哈
全程没有废话,全是干货!
Sugarzh
Sugarzh
5天前
这语速这信息密度,大赞
嘉宾不错,有逻辑,有想法,三观正
我觉得大多数人还是不会用,模型要提供足够的上下文,做足够的评估,对自己的作业做好优化,才能用好,不能老想着一把过,这样会越用越累。
我准备写一篇文章,呼吁大家用deepseek的api。让deepseek的数据飞轮转起来,让deepseek更有钱! 别再帮美国模型了。我实测,deepseek v4已经完全可以平替sonet4.6,只是偶尔会做点出格的事情。就像一个调皮的小孩一样。但是这个小孩是我们自己的,我不能说你调皮,我不爱你了,我去看美国小孩吧。我觉得应该多用,多反馈,deepseek就能越快变更好。
fape:美国大模型的调用量又不是中国大陆个人用户堆起来的。deepseek等国内的从业者对美国模型的使用量才大。
哆啦马里奥:建个墙屏蔽不就好了
3条回复
陌生ZZx
陌生ZZx
8天前
大模型推理适配国产卡很简单,苹果macmini都能推理。真正是后训练这些地方考验国产卡
洛圣都出租车司机:你是不是分不清推理机和客户端呀
xinbabay
xinbabay
8天前
想听AI时代怎么养小孩的专场😁
0xRaymond
:
马上就要来了
chen108:支持!