概要：基于 VQ-VAE+Residual Vector Quantization（RVQ）的量化压缩方案 Residual VQ-VAE，但是考虑到 VLA 中 action 生成的时序性，对借鉴方案进行了调整，在 OpenVLA 这个自回归式的 VLA 架构上进行了验证；值得注意的是，文章提到性能的提升主要由于采用 Residual VQ-VAE 后，整个 VLA 完成任务需要输出的词元数量会明显减少；
声明：上述声音采用AI合成，解析内容为原创；解析仅针对该文发布时，arxiv上已公开被解析论文的最新版本的内容进行；其中所有涉及原论文的图、数据都引用自原论文，如涉及侵权，请及时联系删除；人工解读，难免有错误遗漏，如有发现及时联系修改；如需要深入研究建议阅读原文；
链接：https://arxiv.org/pdf/2507.01016；

SHARE

COMMENT

VOICE_COMMENT

COMMENT_PAGE

CLAP

PICK

VOTE

AI_SUMMARIZE

多模空间

~视觉出身的多模态研究者，5分钟带您从专业角度了解具身智能领域内VLA大模型的最新研究进展~

AI_SUMMARIZE_EPISODE

5分钟快览-具身智能VLA

VQ-VLA：结合量化压缩提高 VLA 效能-上海 AI Lab、同济、中科大、浙大、南大、上交大

6925c5deb76f5d0a4228598b/FjCIcQ1arQpVyDj279Hv1DLjJ36Q.m4a