标签名称：智能体交互

AGILE自监督强化学习提升视觉语言模型感知推理能力

AGILE创新性地将智能体交互与拼图任务结合，通过自监督强化学习范式显著提升视觉语言模型的感知推理能力。该框架在无需人工标注的情况下，使模型在2×2拼图任务中准确率从9.5%提升至82.8%，并在9项通用视觉任务中平均性能提升3.1%，为解决多模态强化学习数据稀缺问题提供了可持续的解决方案。

AI快讯

2025-10-20

AI Tools Nav 收录了全球优质的 AI 工具与人工智能应用平台，覆盖 AI写作、AI绘图、AI编程、AI音频处理、AI视频编辑、AI办公自动化、AI搜索引擎等多个领域，持续每日更新，让你快速找到好用的 AI 工具，提高工作与创作效率。