概要:现有具身领域中基于动作分块(Action Chunking)的强化 Q 学习 方法对所有状态使用固定 chunk 大小,无法兼顾接触精细控制与自由空间高效规划;本文提出的自适应 chunk 大小选择方案解决跨尺度 Q 值比较的偏差坍塌问题,在多个测试集上效果能够显著提升;
声明:上述声音采用AI合成,解析内容为原创;解析仅针对该文发布时,arXiv上已公开被解析论文的最新版本的内容进行;其中所有涉及原论文的图、数据都引用自原论文,如涉及侵权,请及时联系删除;人工解读,难免有错误遗漏,如有发现及时联系修改;如需要深入研究建议阅读原文;
链接:arxiv.org ;

