V12:学界的算法，工业界真的用吗？一场关于AI研究的坦白局

这一期，我邀请到了一位即将入读清华深研院的准研究生。他做的方向，正是当下大模型领域最火的话题之一：强化学习后训练，也就是DeepSeek R1带火的那套技术。

但我们聊的，远不止技术本身。

我们聊了：为什么学界的算法在工业界常常“没用”？为什么数据工作再脏，也是每个AI人的必修课？为什么他说没必要死磕基模，AI for Science可能是更好的赛道？

我们还聊了焦虑——论文发得慢、方向被淘汰、岗位在缩水……这些不是外界强加的，而是AI研究者每天都在面对的现实。

一个身处AI风暴中心的年轻人，怎么看待自己选择的方向？怎么面对未来的不确定性？又怎么在“左脚踩右脚”的AI进化中，找到自己的位置？

如果你也在纠结：要不要转AI？要不要做基模？要不要担心被取代？

你好，我是Nia。欢迎回到《TheZPrompt》——一档属于00后AI原住民的生存对话。

本期梗概

00:00:19 – 00:03:58 ：从NLP强化学习后训练讲起，DeepSeek R1如何把“去掉critic model”这件事带火。

00:03:58 – 00:05:39 ：为什么控制模型上下文的“外挂系统”比模型本身更重要。

00:06:29 – 00:10:11 ：亲身经历：Cursor、Codex CLI到底哪一代开始变得好用？

00:10:50 – 00:13:51 ：科研项目 vs 工程项目

00:14:26 – 00:15:46 ：数据工作再脏，也是必经之路

00:17:14 – 00:21:17 ：学界的算法，工业界真的用吗？

00:21:52 – 00:24:35 ：为什么学界“船小好调头”，但工业界才是验证算法的战场。

00:25:11 – 00:27:10 ：AI研究者的焦虑日常

00:28:17 – 00:30:25 ：工具调用已成共识，还能创新吗？

00:32:24 – 00:35:03 ：GRPO的梯度问题 & 应试式训练

00:36:01 – 00:45:20 ：安全、reward hacking、与小龙虾作弊

00:48:24 – 01:05:04 ：AI会替代人吗？ “实在不行，你可以给它断电。”

01:06:19 – 01:07:44 ：本科生的真诚建议：“没必要死磕基模，AI for Science可能是更好的方向。”

加入我们的声音实验场

我深信，真实的改变，始于真实的对话。

如果你：

是正在用AI探索职业可能的“超级个体”经历了专业转型的阵痛与顿悟在实习或项目中用AI解决了某个棘手问题或单纯对AI时代的个人发展有强烈好奇与思考

我真诚邀请你，成为下一期节目的对话者。

你的经验与困惑，都可能为另一个同龄人点亮微光。

期待你的故事：

邮箱：13080218058@163.com（来信请注明“播客嘉宾”，并附上简单个人介绍）

让我们共同写下，属于这个时代的提示词。

我是Nia，祝大家天天开心，下期见！