流匹配
何恺明团队提出pMF框架:单步无潜空间图像生成,简化流程提升效率
何恺明团队提出了一种名为pixel MeanFlow(pMF)的创新图像生成框架。该框架实现了单步、无需潜空间(Latent-free)的端到端图像生成,通过直接预测去噪图像场(x-prediction)并利用流形假设,简化了传统扩散模型的多步采样和潜空间依赖。实验表明,pMF在ImageNet数据集上取得了优异的FID分数(256x256分辨率下2.22,512x512下2.48),证明了单步无潜空间生成的可行性与竞争力,是迈向更高效、更简洁生成式AI模型的重要一步。
πRL强化学习微调框架优化VLA模型机器人控制性能
πRL是由清华、北大、CMU等机构联合推出的强化学习微调框架,专门针对流匹配VLA模型优化。该框架创新性地提出Flow-Noise和Flow-SDE两种技术方案,解决了流匹配VLA难以计算输出动作对数似然的核心难题。实验结果显示,在LIBERO测试平台上,π0和π0.5模型的成功率分别提升至97.6%和98.3%,在大规模多任务训练中成功率增幅超过40%。该框架已完全开源,为机器人学习领域提供了重要的技术突破。
ReinFlow开源框架:在线强化学习流匹配策略优化机器人性能
ReinFlow是由卡内基梅隆大学、清华大学和德克萨斯大学奥斯汀分校联合开发的开源在线强化学习框架,专门用于微调流匹配策略以优化机器人性能。该框架通过向确定性流路径注入可学习噪声,将流匹配过程转化为随机扩散过程,实现了高效的策略梯度优化。在多个基准测试中,ReinFlow相比预训练模型取得显著性能提升,同时大幅节省训练时间,为机器人学习领域提供了强大的工具支持。