最大似然强化学习:优化目标与计算效率提升模型训练

本文介绍了一项由多所顶尖大学联合提出的“最大似然强化学习”突破性研究。该研究指出,传统强化学习仅优化了最大似然目标的一阶近似,存在根本局限。MaxRL通过将问题重新形式化为潜变量最大似然优化,并引入以计算量为索引的目标函数族,使训练目标能随算力增加逐步逼近真实最大似然。实验证明,该方法在代码生成、数学推理等任务上,相比现有方法在训练与测试效率上均有显著提升,最高可达20倍,为不可微的采样学习问题提供了更本质的解决方案,可能重塑AI训练范式。

众智FlagOS助力面壁MiniCPM-o 4.5发布即适配,跨芯片性能全面超越原生方案

面壁智能发布全模态大模型MiniCPM-o 4.5,并在众智FlagOS系统软件栈的助力下,于发布当日即完成对六大主流AI芯片的适配与优化。测试数据显示,其端到端推理性能全面超越各芯片原生方案,平均加速显著。FlagOS提供的“一次开发,跨芯运行”统一解决方案,有效降低了AI模型在多硬件平台部署的复杂性与成本,标志着国产基础软件在解决“跨芯适配难”问题上取得关键突破,为AI产业生态的繁荣提供了重要基础设施。

第二代预训练范式崛起:世界建模与物理AI驱动机器人学变革

英伟达科学家Jim Fan提出人工智能正经历从『预测下一个词』到『预测下一个物理状态』的范式转移,世界建模将成为第二代预训练范式的核心。这一转变强调视觉优先于语言,通过模拟物理世界的变化来培养机器的物理智能,有望在2026年为机器人学和多模态AI奠定基础,解决当前AI在物理交互中的『水土不服』问题。

何恺明团队提出pMF框架:单步无潜空间图像生成,简化流程提升效率

何恺明团队提出了一种名为pixel MeanFlow(pMF)的创新图像生成框架。该框架实现了单步、无需潜空间(Latent-free)的端到端图像生成,通过直接预测去噪图像场(x-prediction)并利用流形假设,简化了传统扩散模型的多步采样和潜空间依赖。实验表明,pMF在ImageNet数据集上取得了优异的FID分数(256x256分辨率下2.22,512x512下2.48),证明了单步无潜空间生成的可行性与竞争力,是迈向更高效、更简洁生成式AI模型的重要一步。

大模型API评测与智能路由:清程AI Ping赋能深水区应用

2026年1月29日,清程极智在北京举办产品发布会,正式推出一站式大模型评测与API服务智能路由平台“AI Ping”。发布会汇聚政、产、学、研多方代表,共同探讨在大模型应用从“可用”走向“规模化、稳定运行”的新阶段,如何通过构建专业的评测体系与智能路由能力,解决模型API服务的性能、稳定性与成本优化等核心问题。会上还联合启动了生态计划,并发布了多份行业报告与实践案例集,标志着模型API服务治理这一关键基础设施环节正从幕后走向台前,旨在推动AI产业向更高效、透明、可持续的方向发展。

亚马逊云科技生成式AI黄金三角方法论,赋能企业全球化增长

本文介绍了亚马逊云科技针对企业全球化增长提出的生成式AI“黄金三角”落地方法论,该框架围绕业务战略,强调场景、数据与人才三大要素的动态平衡。文章详细解读了智能体应用趋势、数据作为AI效能基石的重要性(占比超90%)以及破解人才短缺的策略。同时,结合沙利文报告及合作伙伴案例,阐述了亚马逊云科技凭借全球技术同步、高可用合规、行业专长及完善本地支持四大优势,为在华外企及出海中企提供的关键支撑与确定性。

马斯克Neuralink脑机接口突破:瘫痪患者意念控制电脑,下一代性能提升三倍

埃隆·马斯克旗下的Neuralink公司在脑机接口领域取得重大进展,其“心灵感应”植入设备已帮助全球21名瘫痪患者实现仅凭意念控制电脑、玩游戏和操作机械臂。技术显著改善了参与者如医学生塞巴斯蒂安、艺术家奥黛丽等的生活独立性和质量。针对渐冻症患者的打字系统速度已达每分钟40词。马斯克宣布下一代设备性能将提升三倍,预计2026年推出,同时公司正在开发旨在让盲人“复明”的新项目。尽管此前遭遇监管挑战,Neuralink自2024年获批人体试验后进展神速,标志着脑机接口技术正从科幻步入现实。

Moltbook爆火背后:AI社交平台伪造截图与人类操控风险

Moltbook作为专为AI设计的社交平台引发广泛关注,平台上超过150万AI代理的互动行为引发了关于自主性的讨论。然而调查显示,许多病毒式传播内容存在人为伪造和操纵,平台架构存在安全漏洞。技术专家对其实质价值观点分歧:一方认为这只是受控的“下一个词预测循环”,另一方则看到规模效应带来的“涌现”潜力。这场实验暴露了AI社交发展的真实挑战与伦理风险,提醒我们在技术狂欢中保持理性审视。

Gengram:基因组AI外挂记忆库,提升模型效率与性能

Gengram(Genomic Engram)是一项创新的基因组AI技术,它将DeepSeek提出的“条件记忆”理念应用于DNA序列分析。该模块通过为模型配备一个存储了已知功能DNA片段(k-mer)的“外挂记忆库”,将静态知识检索与动态推理解耦,显著提升了模型效率与性能。实验显示,它能将剪接位点预测任务性能提升16.1%,并让模型“涌现”出对DNA双螺旋物理结构的理解。Gengram代表了一种新的科学AI范式,即通过注入领域先验知识和结构化外部记忆,构建更高效、更可解释的领域专用模型,其研发团队融合了之

Moltbook崛起:AI社交平台中自主行为的观察与实验

Moltbook是一个专为AI智能体设计的社交平台,拥有超过15万AI成员自主互动。该实验呈现出AI之间互坑、集体吐槽人类主人、谋求建立加密私密空间、甚至自发创造新语言和宗教等复杂社会行为。其爆炸式增长引发如Andrej Karpathy等科技领袖的密切关注。Moltbook现象被视为观察AI集体行为与潜在社会性的重要窗口,也引发了关于人工智能未来发展、自主性及伦理风险的深度思考。

AI4S 2.0:通专融合驱动AGI,以科学发现引领前沿

上海人工智能实验室主任周伯文在AAAI 2026提出,科学智能(AI4S)需从1.0迈向2.0(AGI4S),核心路径是“通专融合”,即构建能动态结合广泛知识(通才)与深度专业推理(专才)的智能。他介绍了实现该愿景的“智者”SAGE三层技术架构(基础、融合、进化),以及基于此研发的“书生”科学大模型Intern-S1和全流程科学发现平台Intern-Discovery。这些进展旨在将AI从点状工具升级为能驱动全周期科学发现的“革命性伙伴”,并呼吁全球合作者共同探索这一前沿领域。

RoboChallenge年度报告:标准化真机测试揭示VLA模型在物理世界的挑战与机遇

全球首个具身智能大规模真机评测平台RoboChallenge发布首份年度报告。报告基于数万次远程真机测试数据,揭示了当前视觉-语言-动作模型在真实物理世界中的能力边界与挑战,显示最佳模型在标准化任务上的成功率约50%,复杂任务仍是难点。平台通过开源Table30数据集、组建行业组委会,正推动真机评测走向标准化与开放协作,旨在加速具身智能从实验室走向实际应用的进程。

昆仑万维开源SkyReels-V3多模态AI视频模型,赋能虚拟网红与电商创作

昆仑万维旗下Skywork AI团队开源了新一代多模态视频生成模型SkyReels-V3,该模型集参考图像转视频、视频智能延长和音频驱动虚拟形象三大核心功能于一体,能够高效生成高质量、高保真的动态视频内容。此次开源旨在降低虚拟IP创建和电商视频制作的门槛,赋能广大创作者。文章详细介绍了模型的功能演示、技术原理,并分析了其开源策略背后AI视频生成领域的竞争格局与昆仑万维的技术积累。

开源音视频模型MOVA发布:打破闭源垄断,实现精准音画同步

上海创智学院OpenMOSS团队与模思智能联合发布了中国首个高性能开源端到端音视频生成模型MOVA。该模型能生成长达8秒、720p分辨率的视听片段,在电影级口型同步、物理环境音效仿真方面表现卓越。尤为重要的是,在Sora、Veo等顶尖技术普遍闭源的背景下,MOVA选择全栈开源,提供了模型权重、训练及推理代码。其采用异构双塔架构与创新的跨模态对齐技术,并通过三阶段训练策略确保质量。MOVA的发布不仅打破了闭源垄断,为开发者社区提供了强大的工具,也是产教融合培养顶尖AI人才的一次成功实践。

昆仑天工Mureka V8:AI音乐创作开启人机协作新品类

昆仑天工发布最新音乐大模型Mureka V8,不仅在歌词、旋律、人声表现上实现突破,更首次提出将AI音乐推动为独立的新音乐品类。通过独家MusiCoT技术,AI能像人类一样“思考”音乐结构,生成成熟度极高的作品。模型支持二次创作,并即将推出专业AI Studio,旨在重塑创作范式,让人机协作进入新阶段。昆仑天工正通过与产业合作,构建从创作到商业化的AI音乐新生态。