知名AI专家、《从零开始构建大语言模型》作者Sebastian Raschka博士的2025年度回顾。文章深入剖析了这一年大语言模型领域的重大突破：DeepSeek R1开启推理模型新纪元，RLVR与GRPO技术革新训练范式，顶尖模型训练成本降至500万美元级别。作者系统梳理了从RLHF到GRPO的技术演进路径，探讨了基准测试困境、AI与人类协作的平衡之道，并预测2026年RLVR将扩展至更多领域、推理时扩展成为关键。文章不仅涵盖技术前沿，更分享了作者作为独立研究者的实践心得与对AI可持续使用的深刻思考。这是一份兼具深度与广度的年度技术总结，适合所有关注AI发展的读者。
原文地址：https://magazine.sebastianraschka.com/p/state-of-llms-2025

SHARE

COMMENT

VOICE_COMMENT

COMMENT_PAGE

CLAP

PICK

VOTE

AI_SUMMARIZE

胡言Ray语

Ray_Hu

在科技技术狂奔的时代，有一些文章如同行业的 “思想灯塔”—— 它们不沉迷于复杂公式，却能戳中技术演进范式的核心；不追逐短期热点，却能影响数年甚至数十年的研发方向。《AI智识录》，就是为你打捞这些 “AI 技术领域传世智识” 的播客阵地。

不必再对着长文屏幕费力精读，通勤路上、午后小憩时，打开《AI智识录》，让清晰的 AI 主播带你走进 AI 技术的 “思想原典”—— 这里没有碎片化的信息堆砌，只有经得起时间检验的深度认知；没有跟风的观点喧嚣，只有能帮你看懂技术本质的底层逻辑。

订阅《AI智识录》，用耳朵 “翻阅” AI 行业的 “思想年轮”，抓住那些真正决定未来的核心智识。

AI_SUMMARIZE_EPISODE

AI智识录

知名AI教育家Sebastian Raschka的2025 年大语言模型发展报告

665593980c1cea6c57faa3b9/lvuXhOP30psbEPCuLZ0ca2RpW--h.m4a