十五分钟讲解 Deepseek R1-zero 训练过程AI 前线

十五分钟讲解 Deepseek R1-zero 训练过程

22分钟 ·
播放数358
·
评论数4

2025年1月31日,OpenAI 发布了 O1 模型的改进版 O3 mini,

O3 mini 进行推理思考时,英文和中文混着讲,一会儿英文一会儿中文。

OpenAI O3 mini 是否蒸馏了 Deepseek 模型?

要回答这个问题,我们要先了解 OpenAI 的内部工作流程,Deepseek 的内部工作流程,然后两者横向比较,

本期节目花 15 分钟,用普通人都能听得懂的语言,读解 Deepseek R1-zero 模型的工作原理。

展开Show Notes
csdn直播慕名而来,老师讲得真好啊!😭😭
邓侃AI
:
☺️☺️
Zonefat
Zonefat
2025.2.19
通俗易懂!
Jooey
Jooey
2025.2.09
GRPO 不是这个意思……