AI快讯

北京智研院NPR框架：原生并行推理加速大模型复杂任务处理

北京通用人工智能研究院（BIGAI）提出原生并行推理器（NPR）框架，旨在解决大语言模型处理复杂推理任务时的瓶颈。该框架通过“自蒸馏+并行强化学习”三阶段训练范式，使模型获得内在的并行推理能力，能同时探索多条路径并汇总结果。实验表明，NPR在多个高难度数学推理基准上显著提升了准确率与效率（最高加速4.6倍），且并行行为稳健，为下一代AI智能体的发展提供了新思路。

AI快讯

2025-12-28

本文探讨了在AI编程时代下，程序员群体面临的技能重构压力与行业变革焦虑。通过援引AI专家Andrej Karpathy、资深工程师Boris Cherny等人的观点，揭示了编程工作正从“编写代码”转向“串联与指挥AI工具”的根本性变化。文章同时呈现了乐观拥抱变革与保守批评（如Rob Pike）的不同声音，并引用数据说明AI能力正以超预期速度增长。最终引导读者思考在技术加速曲线中，如何定位自身并展望未来。

AI快讯

2025-12-28

视频生成DeepSeek时刻！清华&生数开源框架提速200倍，一周斩获2k Star

AI快讯

2025-12-27

微观空间智能：AI驱动分子结构与药物研发的视觉语言模型基准挑战

来自中国顶尖高校与机构的研究团队联合发布了全球首个微观空间智能（MiSI）基准测试——MiSI-Bench。该基准包含16.3万个问答对和59万张分子图像，系统评估视觉语言模型（VLM）感知和推理原子、分子等微观实体空间关系的能力。研究揭示了当前顶级AI模型在微观空间推理上的潜力与局限：经过微调后，模型在复杂空间变换任务上可超越人类，但在依赖深度领域知识（如氢键识别）的任务上仍有差距。这项工作为AI在药物设计、材料科学等领域的应用奠定了重要评估基础，是迈向科学通用人工智能（Scientific AGI）的

AI快讯

2025-12-27

Poetiq与GPT-5.2推理编排系统ARC-AGI-2：无需微调提升AI性能

AI初创公司Poetiq通过其创新的Meta-System（推理编排系统），在未对底层模型进行任何微调的情况下，显著提升了GPT-5.2 X-High在权威复杂推理基准ARC-AGI-2上的性能。测试显示，该系统使模型在PUBLIC-EVAL数据集上取得75%的准确率，较之前SOTA提升约15%，同时单题成本低于8美元。Poetiq系统采用迭代式问题求解和自我审计机制，具备模型无关性，可快速适配不同大模型，展现了在模型之上构建智能、通过优化推理过程而非改变模型本身来释放AI潜力的新范式。

AI快讯

2025-12-26

腾讯加速AI布局：混元大模型开源，推动智能体与应用落地

2025年末，腾讯通过引进前OpenAI科学家姚顺雨、升级AI研发架构、开源混元世界模型等一系列组合拳，全面加速其人工智能战略布局。公司正着力打通从底层模型研发（如混元大模型）、工程化基础设施（如AI Infra部、TI平台），到中层工具链开源（如Youtu系列组件），再到上层行业应用落地（如金融、传媒、零售等场景）的全链路能力，构建“研究+工程”双轮驱动的AI生态体系，旨在推动智能体（Agent）技术普及并创造实际商业价值。

AI快讯

2025-12-26

北航研究揭示代码大模型训练中编程语言差异，优化数据配比提升多语言协同效率

北京航空航天大学联合团队的最新研究《Scaling Laws for Code: Every Programming Language Matters》颠覆了代码大模型训练的传统认知。研究通过超千次实验发现，不同编程语言在训练动力学上存在本质差异：Python潜力巨大但难学透，Rust则快速收敛。研究首次构建了量化语言协同效应的矩阵，揭示了非对称的迁移规律，并提出了创新的“并行配对”数据策略以激发零样本泛化能力。最终，团队基于边际效用原则，给出了科学的最优Token分配方案，指导研究者在固定算力下实现性能

AI快讯

2025-12-25

2025-12-24

北京智研院NPR框架：原生并行推理加速大模型复杂任务处理

AI编程时代：程序员技能重构与行业变革应对焦虑

视频生成DeepSeek时刻！清华&生数开源框架提速200倍，一周斩获2k Star

微观空间智能：AI驱动分子结构与药物研发的视觉语言模型基准挑战

Poetiq与GPT-5.2推理编排系统ARC-AGI-2：无需微调提升AI性能

腾讯加速AI布局：混元大模型开源，推动智能体与应用落地

北航研究揭示代码大模型训练中编程语言差异，优化数据配比提升多语言协同效率

谁还敢说谷歌掉队？2025年，它打了一场漂亮的翻身仗

当世界模型不止「视频」该如何评估？WorldLens提出实用化评估新框架

机器之心回顾2025全球AI顶会与展望2026学术社区趋势

AI导航

AI快讯