这一期,我邀请到了一位即将入读清华深研院的准研究生。他做的方向,正是当下大模型领域最火的话题之一:强化学习后训练,也就是DeepSeek R1带火的那套技术。
但我们聊的,远不止技术本身。
我们聊了:为什么学界的算法在工业界常常“没用”?为什么数据工作再脏,也是每个AI人的必修课?为什么他说没必要死磕基模,AI for Science可能是更好的赛道?
我们还聊了焦虑——论文发得慢、方向被淘汰、岗位在缩水……这些不是外界强加的,而是AI研究者每天都在面对的现实。
一个身处AI风暴中心的年轻人,怎么看待自己选择的方向?怎么面对未来的不确定性?又怎么在“左脚踩右脚”的AI进化中,找到自己的位置?
如果你也在纠结:要不要转AI?要不要做基模?要不要担心被取代?
你好,我是Nia。欢迎回到《TheZPrompt》——一档属于00后AI原住民的生存对话。
本期梗概
00:00:19 – 00:03:58 :从NLP强化学习后训练讲起,DeepSeek R1如何把“去掉critic model”这件事带火。
00:03:58 – 00:05:39 :为什么控制模型上下文的“外挂系统”比模型本身更重要。
00:06:29 – 00:10:11 :亲身经历:Cursor、Codex CLI到底哪一代开始变得好用?
00:10:50 – 00:13:51 :科研项目 vs 工程项目
00:14:26 – 00:15:46 :数据工作再脏,也是必经之路
00:17:14 – 00:21:17 :学界的算法,工业界真的用吗?
00:21:52 – 00:24:35 :为什么学界“船小好调头”,但工业界才是验证算法的战场。
00:25:11 – 00:27:10 :AI研究者的焦虑日常
00:28:17 – 00:30:25 :工具调用已成共识,还能创新吗?
00:32:24 – 00:35:03 :GRPO的梯度问题 & 应试式训练
00:36:01 – 00:45:20 :安全、reward hacking、与小龙虾作弊
00:48:24 – 01:05:04 :AI会替代人吗? “实在不行,你可以给它断电。”
01:06:19 – 01:07:44 :本科生的真诚建议 :“没必要死磕基模,AI for Science可能是更好的方向。”
加入我们的声音实验场
我深信,真实的改变,始于真实的对话。
如果你:
是正在用AI探索职业可能的“超级个体”经历了专业转型的阵痛与顿悟在实习或项目中用AI解决了某个棘手问题或单纯对AI时代的个人发展有强烈好奇与思考
我真诚邀请你,成为下一期节目的对话者。
你的经验与困惑,都可能为另一个同龄人点亮微光。
期待你的故事:
邮箱:13080218058@163.com(来信请注明“播客嘉宾”,并附上简单个人介绍)
让我们共同写下,属于这个时代的提示词。
我是Nia,祝大家天天开心,下期见!
