自监督强化学习
空间智能再进化:Spatial-SSRL与LVLM推动自监督强化学习下的空间理解
上海人工智能实验室联合多所高校研发的Spatial-SSRL技术,通过创新的自监督强化学习范式,无需外部标注即可显著提升视觉大语言模型的空间理解能力。该技术基于RGB和RGB-D图像构建五种自监督任务,在Qwen2.5-VL和Qwen3-VL架构上实现平均3.89%-4.63%的性能提升,同时完美保持模型原有通用视觉能力,为自动驾驶和具身智能等领域提供了低成本、高效率的空间智能解决方案。
AGILE自监督强化学习提升视觉语言模型感知推理能力
AGILE创新性地将智能体交互与拼图任务结合,通过自监督强化学习范式显著提升视觉语言模型的感知推理能力。该框架在无需人工标注的情况下,使模型在2×2拼图任务中准确率从9.5%提升至82.8%,并在9项通用视觉任务中平均性能提升3.1%,为解决多模态强化学习数据稀缺问题提供了可持续的解决方案。