开源模型

国产大模型Kimi K2.5发布:开源模型性能对标顶尖闭源,视觉与编程能力全面升级

月之暗面正式发布Kimi K2.5大模型,这是一个拥有1万亿参数的开源MoE模型,在视觉理解、编程能力和智能体协作方面实现重大突破。K2.5在多项评测中性能对标甚至超越顶尖闭源模型,同时成本显著降低。新模型支持图像直接转代码、智能体集群并行处理复杂任务,并推出了Kimi Code编程助手。实测显示其在创意任务、3D重建、语言创造和实用工具开发等方面表现卓越,标志着中国开源大模型技术达到新高度,推动AI向通用人工智能迈进。

英伟达CES发布桌面AI超算DGX,本地运行千亿参数大模型

在CES 2024上,英伟达发布了革命性的桌面AI超级计算机DGX Spark和DGX Station。这两款基于Grace Blackwell架构的设备,将数据中心级的算力浓缩至桌面,分别支持本地运行千亿级和万亿级参数的大语言模型。通过先进的硬件设计、NVFP4数据压缩格式以及与开源社区的深度合作,它们为开发者、研究机构和企业提供了强大的本地AI开发、微调与部署平台,同时英伟达还宣布了配套的企业AI套件订阅服务及面向游戏、机器人等领域的扩展支持计划。

DeepSeek-Math-V2开源:自我验证机制实现IMO金牌级数学推理

DeepSeek-Math-V2开源模型通过创新的自我验证机制,在数学推理领域实现重大突破。该模型采用验证器-生成器协同系统,通过专业评分、元验证监督和诚实奖励机制,确保推理过程的严谨性,在IMO等顶级数学竞赛中达到金牌级水平,为AI数学推理开辟了新的研究方向。