机器人学习

具身智能通用突破:情境数据采集驱动物理智能发展

本文探讨了具身智能发展面临的数据瓶颈,并重点介绍了深度机智公司通过“情境数据采集”模式破解这一难题的创新实践。文章指出,传统数据采集方式导致模型过拟合,而基于人类第一视角、融入丰富环境上下文的情境数据,能让AI理解动作背后的逻辑,实现技能的泛化迁移。深度机智与高校合作建立示范中心,利用自研DeepAct引擎大规模采集真实场景数据,为构建通用的物理智能系统奠定坚实的数据基础,推动机器人从机械模仿走向真正的自主智能。

πRL强化学习微调框架优化VLA模型机器人控制性能

πRL是由清华、北大、CMU等机构联合推出的强化学习微调框架,专门针对流匹配VLA模型优化。该框架创新性地提出Flow-Noise和Flow-SDE两种技术方案,解决了流匹配VLA难以计算输出动作对数似然的核心难题。实验结果显示,在LIBERO测试平台上,π0和π0.5模型的成功率分别提升至97.6%和98.3%,在大规模多任务训练中成功率增幅超过40%。该框架已完全开源,为机器人学习领域提供了重要的技术突破。

ReinFlow开源框架:在线强化学习流匹配策略优化机器人性能

ReinFlow是由卡内基梅隆大学、清华大学和德克萨斯大学奥斯汀分校联合开发的开源在线强化学习框架,专门用于微调流匹配策略以优化机器人性能。该框架通过向确定性流路径注入可学习噪声,将流匹配过程转化为随机扩散过程,实现了高效的策略梯度优化。在多个基准测试中,ReinFlow相比预训练模型取得显著性能提升,同时大幅节省训练时间,为机器人学习领域提供了强大的工具支持。