VLA模型

RoboChallenge年度报告:标准化真机测试揭示VLA模型在物理世界的挑战与机遇

全球首个具身智能大规模真机评测平台RoboChallenge发布首份年度报告。报告基于数万次远程真机测试数据,揭示了当前视觉-语言-动作模型在真实物理世界中的能力边界与挑战,显示最佳模型在标准化任务上的成功率约50%,复杂任务仍是难点。平台通过开源Table30数据集、组建行业组委会,正推动真机评测走向标准化与开放协作,旨在加速具身智能从实验室走向实际应用的进程。

πRL强化学习微调框架优化VLA模型机器人控制性能

πRL是由清华、北大、CMU等机构联合推出的强化学习微调框架,专门针对流匹配VLA模型优化。该框架创新性地提出Flow-Noise和Flow-SDE两种技术方案,解决了流匹配VLA难以计算输出动作对数似然的核心难题。实验结果显示,在LIBERO测试平台上,π0和π0.5模型的成功率分别提升至97.6%和98.3%,在大规模多任务训练中成功率增幅超过40%。该框架已完全开源,为机器人学习领域提供了重要的技术突破。

ReinFlow开源框架:在线强化学习流匹配策略优化机器人性能

ReinFlow是由卡内基梅隆大学、清华大学和德克萨斯大学奥斯汀分校联合开发的开源在线强化学习框架,专门用于微调流匹配策略以优化机器人性能。该框架通过向确定性流路径注入可学习噪声,将流匹配过程转化为随机扩散过程,实现了高效的策略梯度优化。在多个基准测试中,ReinFlow相比预训练模型取得显著性能提升,同时大幅节省训练时间,为机器人学习领域提供了强大的工具支持。