AI快讯
最大似然强化学习:优化目标与计算效率提升模型训练
本文介绍了一项由多所顶尖大学联合提出的“最大似然强化学习”突破性研究。该研究指出,传统强化学习仅优化了最大似然目标的一阶近似,存在根本局限。MaxRL通过将问题重新形式化为潜变量最大似然优化,并引入以计算量为索引的目标函数族,使训练目标能随算力增加逐步逼近真实最大似然。实验证明,该方法在代码生成、数学推理等任务上,相比现有方法在训练与测试效率上均有显著提升,最高可达20倍,为不可微的采样学习问题提供了更本质的解决方案,可能重塑AI训练范式。
众智FlagOS助力面壁MiniCPM-o 4.5发布即适配,跨芯片性能全面超越原生方案
面壁智能发布全模态大模型MiniCPM-o 4.5,并在众智FlagOS系统软件栈的助力下,于发布当日即完成对六大主流AI芯片的适配与优化。测试数据显示,其端到端推理性能全面超越各芯片原生方案,平均加速显著。FlagOS提供的“一次开发,跨芯运行”统一解决方案,有效降低了AI模型在多硬件平台部署的复杂性与成本,标志着国产基础软件在解决“跨芯适配难”问题上取得关键突破,为AI产业生态的繁荣提供了重要基础设施。
第二代预训练范式崛起:世界建模与物理AI驱动机器人学变革
英伟达科学家Jim Fan提出人工智能正经历从『预测下一个词』到『预测下一个物理状态』的范式转移,世界建模将成为第二代预训练范式的核心。这一转变强调视觉优先于语言,通过模拟物理世界的变化来培养机器的物理智能,有望在2026年为机器人学和多模态AI奠定基础,解决当前AI在物理交互中的『水土不服』问题。
何恺明团队提出pMF框架:单步无潜空间图像生成,简化流程提升效率
何恺明团队提出了一种名为pixel MeanFlow(pMF)的创新图像生成框架。该框架实现了单步、无需潜空间(Latent-free)的端到端图像生成,通过直接预测去噪图像场(x-prediction)并利用流形假设,简化了传统扩散模型的多步采样和潜空间依赖。实验表明,pMF在ImageNet数据集上取得了优异的FID分数(256x256分辨率下2.22,512x512下2.48),证明了单步无潜空间生成的可行性与竞争力,是迈向更高效、更简洁生成式AI模型的重要一步。
大模型API评测与智能路由:清程AI Ping赋能深水区应用
2026年1月29日,清程极智在北京举办产品发布会,正式推出一站式大模型评测与API服务智能路由平台“AI Ping”。发布会汇聚政、产、学、研多方代表,共同探讨在大模型应用从“可用”走向“规模化、稳定运行”的新阶段,如何通过构建专业的评测体系与智能路由能力,解决模型API服务的性能、稳定性与成本优化等核心问题。会上还联合启动了生态计划,并发布了多份行业报告与实践案例集,标志着模型API服务治理这一关键基础设施环节正从幕后走向台前,旨在推动AI产业向更高效、透明、可持续的方向发展。
亚马逊云科技生成式AI黄金三角方法论,赋能企业全球化增长
本文介绍了亚马逊云科技针对企业全球化增长提出的生成式AI“黄金三角”落地方法论,该框架围绕业务战略,强调场景、数据与人才三大要素的动态平衡。文章详细解读了智能体应用趋势、数据作为AI效能基石的重要性(占比超90%)以及破解人才短缺的策略。同时,结合沙利文报告及合作伙伴案例,阐述了亚马逊云科技凭借全球技术同步、高可用合规、行业专长及完善本地支持四大优势,为在华外企及出海中企提供的关键支撑与确定性。