国产大模型Kimi K2.5发布:开源模型性能对标顶尖闭源,视觉与编程能力全面升级
国产大模型Kimi K2.5震撼发布:开源性能对标顶尖闭源,视觉与编程能力全面进化
中国人工智能领域迎来了一场激动人心的“模型大战”。继昨日千问模型更新、今日DeepSeek开源OCR 2之后,月之暗面公司于中午正式发布了备受期待的Kimi K2.5模型。这次更新覆盖了网站、移动应用、API开放平台以及编程助手产品Kimi Code,标志着国产大模型技术迈入全新阶段。
月之暗面创始人杨植麟首次通过视频形式向公众展示了新模型的强大能力。Kimi K2.5作为拥有1万亿参数的MoE(专家混合)基础模型,在保持开源特性的同时,实现了视觉理解和编程能力的显著提升。
性能表现:开源模型的新标杆
Kimi K2.5在多项权威评测中展现出卓越性能。在HLE(人类最后考试)评测中获得50.2%的分数,BrowseComp测试中达到74.9%,DeepSearchQA等极具挑战性的智能体评测中也取得了当前最佳表现(SOTA)。
编程能力方面,K2.5在SWE-bench Verified测试中获得76.8%的成绩,大幅缩小了与顶尖闭源模型的差距。更令人瞩目的是,在多项视觉理解评测中,K2.5同样实现了开源模型的最佳效果。
与当前最强大的闭源模型相比——包括Opus 4.5、GPT 5.2 XHigh和Gemini 3.0 Pro——Kimi K2.5在核心基准测试中表现相当,部分指标甚至实现超越。尤为重要的是,K2.5在多项评测中优于GPT-5.2-xhigh的同时,运行成本仅为后者的几分之一。
视觉与编程的完美融合
Kimi K2.5是一个真正的全能模型(All-in-One Unified Model),集成了视觉理解、文本处理、对话交互、智能体协作等多种能力。其中最引人注目的是其“图像转代码”功能——用户只需提供设计稿或界面截图,AI就能自动生成相应的代码,无需编写提示词。
这种能力让界面修改变得异常简单:用户可以在UI上圈出需要修改的区域,AI会自动完成剩余工作。甚至可以将动画效果的录屏视频交给Kimi,它能够理解并编写代码复现相同的效果。
更令人惊喜的是,K2.5在编程中展现出一定的“设计审美”。通过结合视觉理解能力,它能够构建出具有高级审美和动态效果的网页,仿佛出自专业设计师之手。这与月之暗面创始人杨植麟在AGI-Next前沿峰会上提出的理念相呼应——让AI具备更好的“品味”是当前发展重点。
Kimi Code:软件工程的新助手
基于K2.5的编程助手产品Kimi Code今日正式发布。它可以在终端中运行,并无缝集成到VSCode、Cursor、Zed等主流IDE中。Kimi Code支持图片和视频输入,能够自动发现并迁移用户现有的技能和MCP到工作环境中。
智能体集群:并行处理复杂任务
为解决现实世界中的复杂问题,Kimi K2.5引入了“Agent Swarm”(智能体集群)功能。在处理复杂任务时,K2.5不再采用单线程执行,而是作为指挥者调度最多100个智能体分身并行工作,支持高达1500次工具调用,速度比单智能体配置快4.5倍。
通过并行智能体强化学习(PARL)训练,智能体集群由K2.5自动创建和编排,无需预定义。这种并行处理能力能够将原本需要数天完成的工作压缩至十几分钟。
在实际应用中,K2.5智能体可以端到端处理高密度、大规模的办公任务,包括文档处理、电子表格分析、PDF编辑和幻灯片制作。输出能力也达到新高度——可以生成万字论文或100页的专业文档。
实测体验:从创意到实现
在实际测试中,Kimi K2.5展现出令人印象深刻的能力:
- 创意任务:轻松完成加密文字游戏,将“明天下午三点撤离”信息巧妙隐藏在看似普通的电台点歌词中
- 视觉理解:准确识别《生活大爆炸》谢尔顿公寓的手绘平面图,并理解其背景信息
- 3D重建:根据平面图生成3D公寓模型,虽然初版缺少细节,但通过智能体模式能够生成更精细的版本
- 语言创造:为深海发光生物设计完整的语言系统,包括语法结构、200个基础词条和3篇创世神话
- 实用工具:快速创建金银价格监控器,自动处理错误并优化代码
- 文件处理:批量将docx文档转换为Obsidian兼容的Markdown格式并自动打标签
技术突破与行业影响
Kimi K2.5的发布标志着中国开源大模型技术达到新高度。月之暗面为智能体集群的规模化训练重构了强化学习基础设施,并专门优化了训练算法,确保极致的效率和性能。
社交网络上,用户对新模型的试用反馈热烈。有网友评价:“这才是中国大模型(没有定语)最优秀的水准”,并将压力传递给其他竞争对手。
展望未来
Kimi K2.5不仅为全球开源大模型树立了新标杆,更重要的是,它通过视觉和智能体能力的突破,让AI在真实世界中解决复杂问题的能力得到显著提升。当AI在编写代码时开始具备审美,当上百个智能体能够协同工作,我们距离通用人工智能(AGI)的目标又近了一步。
中国的开源模型正在从跟随者转变为规则的制定者,Kimi K2.5的发布无疑是这一进程中的重要里程碑。随着技术的不断进步,我们有理由期待AI将在更多领域发挥变革性作用。
想获取更多AI最新资讯与智能工具推荐, 欢迎访问 👉 AI Tools Nav ——优质的 AI导航平台 与 AI学习社区
本文来源:机器之心
原文链接:https://www.jiqizhixin.com/articles/7c7700ca-7363-40a5-80f1-e8757e594756