开源AI模型
国产大模型Kimi K2.5发布:开源模型性能对标顶尖闭源,视觉与编程能力全面升级
月之暗面正式发布Kimi K2.5大模型,这是一个拥有1万亿参数的开源MoE模型,在视觉理解、编程能力和智能体协作方面实现重大突破。K2.5在多项评测中性能对标甚至超越顶尖闭源模型,同时成本显著降低。新模型支持图像直接转代码、智能体集群并行处理复杂任务,并推出了Kimi Code编程助手。实测显示其在创意任务、3D重建、语言创造和实用工具开发等方面表现卓越,标志着中国开源大模型技术达到新高度,推动AI向通用人工智能迈进。
空间智能再进化:Spatial-SSRL与LVLM推动自监督强化学习下的空间理解
上海人工智能实验室联合多所高校研发的Spatial-SSRL技术,通过创新的自监督强化学习范式,无需外部标注即可显著提升视觉大语言模型的空间理解能力。该技术基于RGB和RGB-D图像构建五种自监督任务,在Qwen2.5-VL和Qwen3-VL架构上实现平均3.89%-4.63%的性能提升,同时完美保持模型原有通用视觉能力,为自动驾驶和具身智能等领域提供了低成本、高效率的空间智能解决方案。
DeepSeek-OCR视觉压缩技术颠覆文本处理,效率提升十倍引AI界关注
DeepSeek-OCR通过创新的视觉压缩技术实现文本处理效率十倍提升,将1000字文章压缩为100个视觉token并保持97%精度,这一突破可能改变大语言模型的输入范式,引发AI社区对像素输入替代文本输入的深入讨论。