近期，OpenAI在博文中透露Test-Time Scaling，在训练强化学习阶段，所需要的算力并不比预训练少，这一点上人类经常会误判。OpenAI 在训练 代号草莓Strawberry的o1 模型时，通过上万张 H100训练数月，还没有结束，所以推出了o1 preview版，算力代价是非常高！后续猎户座，即GPT-5，参数量可能会继续飙升，以实现更好的推理路径。如李飞飞教授一直强调的，数据质量非常关键，怎么去构造生成数据的算法，以及self-play用的主模型能力就变得非常重要！

SHARE

COMMENT

VOICE_COMMENT

COMMENT_PAGE

CLAP

PICK

VOTE

AI_SUMMARIZE

田丰说

快思慢想研究院院长，
商汤智能产业研究院创始院长，
阿里云研究院创始院长，
《田丰说》视频策划人

AI_SUMMARIZE_EPISODE

第240集 OpenAI o1 算力消耗大！