人工智能

AAAI 2026视频扩散模型:基于物理直觉生成科学现象的潜在知识探索

东方理工与上海交大联合团队在AAAI 2026发表创新研究,提出潜在知识引导的视频扩散框架,突破性地实现从单帧图像生成符合物理规律的科学现象演化过程。该方法通过静态特征解析、动态趋势预测和跨模态知识转换三重机制,为生成式AI注入物理直觉,在流体模拟和台风预测任务中显著提升生成质量,标志着AI从视觉生成向科学生成的重要转变。

腾讯2025Q3财报:AI生态价值释放,To B业务与云服务强劲增长

腾讯2025年第三季度财报显示总收入1928.7亿元,同比增长15%,其中To B业务表现强劲。AI战略持续深化,混元大模型在多项技术榜单登顶,腾讯元宝打通内部应用生态。云服务与企业需求形成供需共振,带动收入快速增长。研发投入创单季新高达228亿元,云+AI解决方案在医疗、文旅、物流、游戏、教育等多领域落地应用。国际业务成为重要增长引擎,过去三年持续高双位数增长。腾讯将继续加大AI前沿研究,以智能化和国际化驱动业务增长。

北京人形机器人开源Pelican-VL 1.0:DPPO训练突破多模态理解,性能逼近闭源系统

北京人形机器人创新中心开源了具身智能视觉语言模型Pelican-VL 1.0,该模型采用创新的DPPO训练范式,在1000+ A800 GPU集群上训练,性能提升20.3%,超越同类开源模型10.6%,平均性能超过GPT-5和Google Gemini等闭源模型。模型具备强大的多模态理解、时空认知、具身交互和自我纠错能力,为机器人产业提供了可复用的训练范式和开源基础,推动具身智能从实验室走向产业化应用。

openEuler发布全球首个超节点操作系统,引领AI算力开源新纪元

2025操作系统大会上,openEuler发布全球首款面向超节点的操作系统,开启AI算力开源新纪元。经过六年发展,开源欧拉社区已成为中国行业数字化转型首选操作系统,预计2025年底装机量突破1600万套。新系统具备全局资源抽象、异构资源融合等核心特性,将推动AI时代算力基础设施革新,加速全球化生态布局。

字节跳动发布Depth Anything 3:简化Transformer实现高效3D视觉建模

字节跳动最新发布的Depth Anything 3(DA3)通过简化Transformer架构实现突破性3D视觉建模,仅使用标准Transformer和单一深度射线表示就在姿态估计和几何估计任务中分别实现44%和25%的性能提升。该技术证明了3D视觉研究可避免过度复杂化设计,具备视频重建、SLAM、3D高斯估计和多摄像头空间感知等多元化应用场景,为自动驾驶、机器人导航等领域提供强大技术支撑。

EverMind开源EverMemOS长期记忆系统,AI智能体四层架构突破多场景应用

EverMind团队推出革命性EverMemOS长期记忆操作系统,该系统受人类大脑记忆机制启发,采用四层架构设计,在LoCoMo和LongMemEval-S评测中创下新纪录。作为行业首个同时支持一对一对话和多人协作场景的记忆系统,EverMemOS实现了从记忆存储库到记忆处理器的升级,通过分层记忆提取和模块化框架解决了AI在长时程任务中的记忆断层问题,目前已在GitHub开源,预计年底推出云服务版本。

夸克接入千问AI助手,阿里巴巴推出全新Qwen模型浏览器

阿里巴巴完成夸克浏览器与千问AI助手的深度整合,推出基于Qwen大模型的新一代AI浏览器。在全球科技企业竞相布局AI浏览器的背景下,阿里凭借性能全球领先的Qwen系列模型,特别是最新发布的Qwen3-Max旗舰模型,在人工智能浏览器领域确立重要竞争优势。

DeepSeek开源LPLB负载均衡器:线性规划优化MoE模型训练GPU效率

DeepSeek开源LPLB负载均衡器,采用线性规划算法优化MoE模型训练过程中的GPU负载分配。该技术通过动态重排序、副本构建和最优分配求解三个步骤,有效解决混合专家模型中的负载不均衡问题,提升训练效率。虽然项目处于早期研究阶段,但为AI训练优化提供了创新的技术思路。

2025智源具身智能开放日:开源生态驱动机器人模型创新与产业落地

2025年智源具身智能开放日展示了开源生态驱动下的机器人技术创新成果,包括全栈技术架构、模型突破与人机交互升级。行业专家就技术路径与商业化达成共识,强调从可量化单点任务切入,确保投资回报。智源研究院承诺持续推进开源项目,加速技术从实验室向产业转化。

2025宝山智能机器人产业大会:人形机器人科技创新嘉年华开幕

2025年11月21日,宝山智能机器人产业大会在智慧湾科创园盛大开幕,汇聚政府领导、行业专家和企业代表,发布产业行动方案,启动多个重要平台,通过主旨论坛和展览展示,推动智能机器人产业创新发展,为区域经济注入新动能。