这篇报告介绍了 GLM-4.5系列 模型，包括GLM-4.5和GLM-4.5-Air，它们是清华大学和智谱AI合作开发的开源混合专家（MoE）大型语言模型。这些模型旨在通过结合思维和直接响应模式的混合推理方法，在代理能力、推理能力和编程能力（ARC） 任务中实现卓越性能。论文详细阐述了模型的架构、多阶段训练过程（包括预训练、中期训练和后训练），以及如何通过强化学习和专家模型迭代来提升各项能力。评估结果显示，GLM-4.5在多项ARC基准测试中表现出色，并在总参数量远低于竞争对手的情况下，整体排名第三，代理能力排名第二，凸显了其参数效率高的特点。
Source: <https://arxiv.org/abs/2508.06471>

SHARE

COMMENT

VOICE_COMMENT

COMMENT_PAGE

CLAP

PICK

VOTE

AI_SUMMARIZE

edwardlol

jameszhou2108@hotmail.com

借助 NotebookLM 将精选的热门论文或个人感兴趣的学术内容转化为中文播客，帮助更多人轻松获取前沿知识。

AI_SUMMARIZE_EPISODE

readthepapers

GLM-4.5

68355bd9988e11fcbd89349e/lohr1O4haCL9r_SYT0yMAA6eK1KB.m4a