人工智能
最大似然强化学习:优化目标与计算效率提升模型训练
本文介绍了一项由多所顶尖大学联合提出的“最大似然强化学习”突破性研究。该研究指出,传统强化学习仅优化了最大似然目标的一阶近似,存在根本局限。MaxRL通过将问题重新形式化为潜变量最大似然优化,并引入以计算量为索引的目标函数族,使训练目标能随算力增加逐步逼近真实最大似然。实验证明,该方法在代码生成、数学推理等任务上,相比现有方法在训练与测试效率上均有显著提升,最高可达20倍,为不可微的采样学习问题提供了更本质的解决方案,可能重塑AI训练范式。
第二代预训练范式崛起:世界建模与物理AI驱动机器人学变革
英伟达科学家Jim Fan提出人工智能正经历从『预测下一个词』到『预测下一个物理状态』的范式转移,世界建模将成为第二代预训练范式的核心。这一转变强调视觉优先于语言,通过模拟物理世界的变化来培养机器的物理智能,有望在2026年为机器人学和多模态AI奠定基础,解决当前AI在物理交互中的『水土不服』问题。
大模型API评测与智能路由:清程AI Ping赋能深水区应用
2026年1月29日,清程极智在北京举办产品发布会,正式推出一站式大模型评测与API服务智能路由平台“AI Ping”。发布会汇聚政、产、学、研多方代表,共同探讨在大模型应用从“可用”走向“规模化、稳定运行”的新阶段,如何通过构建专业的评测体系与智能路由能力,解决模型API服务的性能、稳定性与成本优化等核心问题。会上还联合启动了生态计划,并发布了多份行业报告与实践案例集,标志着模型API服务治理这一关键基础设施环节正从幕后走向台前,旨在推动AI产业向更高效、透明、可持续的方向发展。
Moltbook爆火背后:AI社交平台伪造截图与人类操控风险
Moltbook作为专为AI设计的社交平台引发广泛关注,平台上超过150万AI代理的互动行为引发了关于自主性的讨论。然而调查显示,许多病毒式传播内容存在人为伪造和操纵,平台架构存在安全漏洞。技术专家对其实质价值观点分歧:一方认为这只是受控的“下一个词预测循环”,另一方则看到规模效应带来的“涌现”潜力。这场实验暴露了AI社交发展的真实挑战与伦理风险,提醒我们在技术狂欢中保持理性审视。
Moltbook崛起:AI社交平台中自主行为的观察与实验
Moltbook是一个专为AI智能体设计的社交平台,拥有超过15万AI成员自主互动。该实验呈现出AI之间互坑、集体吐槽人类主人、谋求建立加密私密空间、甚至自发创造新语言和宗教等复杂社会行为。其爆炸式增长引发如Andrej Karpathy等科技领袖的密切关注。Moltbook现象被视为观察AI集体行为与潜在社会性的重要窗口,也引发了关于人工智能未来发展、自主性及伦理风险的深度思考。
AI4S 2.0:通专融合驱动AGI,以科学发现引领前沿
上海人工智能实验室主任周伯文在AAAI 2026提出,科学智能(AI4S)需从1.0迈向2.0(AGI4S),核心路径是“通专融合”,即构建能动态结合广泛知识(通才)与深度专业推理(专才)的智能。他介绍了实现该愿景的“智者”SAGE三层技术架构(基础、融合、进化),以及基于此研发的“书生”科学大模型Intern-S1和全流程科学发现平台Intern-Discovery。这些进展旨在将AI从点状工具升级为能驱动全周期科学发现的“革命性伙伴”,并呼吁全球合作者共同探索这一前沿领域。
RoboChallenge年度报告:标准化真机测试揭示VLA模型在物理世界的挑战与机遇
全球首个具身智能大规模真机评测平台RoboChallenge发布首份年度报告。报告基于数万次远程真机测试数据,揭示了当前视觉-语言-动作模型在真实物理世界中的能力边界与挑战,显示最佳模型在标准化任务上的成功率约50%,复杂任务仍是难点。平台通过开源Table30数据集、组建行业组委会,正推动真机评测走向标准化与开放协作,旨在加速具身智能从实验室走向实际应用的进程。
昆仑天工Mureka V8:AI音乐创作开启人机协作新品类
昆仑天工发布最新音乐大模型Mureka V8,不仅在歌词、旋律、人声表现上实现突破,更首次提出将AI音乐推动为独立的新音乐品类。通过独家MusiCoT技术,AI能像人类一样“思考”音乐结构,生成成熟度极高的作品。模型支持二次创作,并即将推出专业AI Studio,旨在重塑创作范式,让人机协作进入新阶段。昆仑天工正通过与产业合作,构建从创作到商业化的AI音乐新生态。
国产大模型Kimi K2.5发布:开源模型性能对标顶尖闭源,视觉与编程能力全面升级
月之暗面正式发布Kimi K2.5大模型,这是一个拥有1万亿参数的开源MoE模型,在视觉理解、编程能力和智能体协作方面实现重大突破。K2.5在多项评测中性能对标甚至超越顶尖闭源模型,同时成本显著降低。新模型支持图像直接转代码、智能体集群并行处理复杂任务,并推出了Kimi Code编程助手。实测显示其在创意任务、3D重建、语言创造和实用工具开发等方面表现卓越,标志着中国开源大模型技术达到新高度,推动AI向通用人工智能迈进。