概要：现有具身领域中基于动作分块（Action Chunking）的强化 Q 学习 方法对所有状态使用固定 chunk 大小，无法兼顾接触精细控制与自由空间高效规划；本文提出的自适应 chunk 大小选择方案解决跨尺度 Q 值比较的偏差坍塌问题，在多个测试集上效果能够显著提升；
声明：上述声音采用AI合成，解析内容为原创；解析仅针对该文发布时，arXiv上已公开被解析论文的最新版本的内容进行；其中所有涉及原论文的图、数据都引用自原论文，如涉及侵权，请及时联系删除；人工解读，难免有错误遗漏，如有发现及时联系修改；如需要深入研究建议阅读原文；
链接：https://arxiv.org/abs/2605.05544 ；

SHARE

COMMENT

VOICE_COMMENT

COMMENT_PAGE

CLAP

PICK

VOTE

AI_SUMMARIZE

多模空间

~视觉出身的多模态研究者，5分钟带您从专业角度了解具身智能领域内VLA大模型的最新研究进展~

AI_SUMMARIZE_EPISODE

5分钟快览-具身智能VLA

AQC：让机器人的动作节奏快慢自如-北京大学、银河通用（Galbot）、多伦多大学

6925c5deb76f5d0a4228598b/FjfYDAMOK0XPu27t2FryBYri0yny.m4a