核心发现:对于简单问题(难度1-2级):DART 实现了高压缩比(56.9%和56.4%),同时保持接近完美的准确率(100.0%和96.7%)对于中等难度问题(难度3级):压缩比略有下降(55.2%),以维持高准确率(98.1%)对于困难问题(难度4-5级):压缩比进一步降低(47.1%和34.0%),模型分配更多计算资源以保证解题精度这一梯度化的自适应行为表明,DART 成功学习了从问题难度到最优推理长度的内在映射。它并非简单地进行均匀压缩,而是动态地为难题分配更多计算资源,同时截断简单题的冗余推理,实现了基于问题复杂度的精细化决策。


上海交通大学团队最新研究让大模型学会更聪明地思考
8分钟 ·
2·
0