AI快讯
AI教育产业化落地:斑马口语多模态交互与适龄内容实践
2025年AI产业迎来关键转折,斑马口语作为业内首款真正实现AI外教一对一教学的产品,在垂直场景落地中突破四大技术障碍:实时交互速度优化至1.5-2.5秒,语音识别精准度提升,内容输出严格适龄控制,多模态呈现稳定同步。其成功实践重构了口语教育赛道竞争规则,从资源比拼转向AI Agent打造能力竞争,为中国AI产业化提供了可借鉴的范例,证明在技术与产业深度融合中,垂直场景的深度打磨比通用能力展示更具商业价值。
夸克接入千问AI助手,阿里巴巴推出全新Qwen模型浏览器
阿里巴巴完成夸克浏览器与千问AI助手的深度整合,推出基于Qwen大模型的新一代AI浏览器。在全球科技企业竞相布局AI浏览器的背景下,阿里凭借性能全球领先的Qwen系列模型,特别是最新发布的Qwen3-Max旗舰模型,在人工智能浏览器领域确立重要竞争优势。
成本仅0.3美元,耗时26分钟!CudaForge:颠覆性低成本CUDA优化框架
CUDA 代码的性能对于当今的模型训练与推理至关重要,然而手动编写优化 CUDA Kernel 需要很高的知识门槛和时间成本。
AI自主「发现」牛顿第二定律?北大概念驱动型发现系统AI-Newton问世
AI自主「发现」牛顿第二定律?北大概念驱动型发现系统AI-Newton问世
EverMind开源EverMemOS长期记忆系统,AI智能体四层架构突破多场景应用
EverMind团队推出革命性EverMemOS长期记忆操作系统,该系统受人类大脑记忆机制启发,采用四层架构设计,在LoCoMo和LongMemEval-S评测中创下新纪录。作为行业首个同时支持一对一对话和多人协作场景的记忆系统,EverMemOS实现了从记忆存储库到记忆处理器的升级,通过分层记忆提取和模块化框架解决了AI在长时程任务中的记忆断层问题,目前已在GitHub开源,预计年底推出云服务版本。
这届NeurIPS 2025太有看头了!11月22日北京见
2025年,AI 的演进正从“能力突破”迈向“系统构建”阶段。
字节跳动发布Depth Anything 3:简化Transformer实现高效3D视觉建模
字节跳动最新发布的Depth Anything 3(DA3)通过简化Transformer架构实现突破性3D视觉建模,仅使用标准Transformer和单一深度射线表示就在姿态估计和几何估计任务中分别实现44%和25%的性能提升。该技术证明了3D视觉研究可避免过度复杂化设计,具备视频重建、SLAM、3D高斯估计和多摄像头空间感知等多元化应用场景,为自动驾驶、机器人导航等领域提供强大技术支撑。
openEuler发布全球首个超节点操作系统,引领AI算力开源新纪元
2025操作系统大会上,openEuler发布全球首款面向超节点的操作系统,开启AI算力开源新纪元。经过六年发展,开源欧拉社区已成为中国行业数字化转型首选操作系统,预计2025年底装机量突破1600万套。新系统具备全局资源抽象、异构资源融合等核心特性,将推动AI时代算力基础设施革新,加速全球化生态布局。
SIGGRAPH Asia 2025推出PSP框架:AI程序化生成可控3D场景
SIGGRAPH Asia 2025会议上发布的PSP框架革命性地改变了3D场景生成方式,通过让AI输出可执行程序脚本而非直接几何数据,实现了高度可控的场景构建。该框架包含程序化场景描述语言PSDL和智能纠错系统,在测试中显著优于传统方法,用户偏好率高达94.3%,生成速度提升至38秒,为游戏开发、虚拟现实和具身智能等领域提供了全新的技术范式。
北京人形机器人开源Pelican-VL 1.0:DPPO训练突破多模态理解,性能逼近闭源系统
北京人形机器人创新中心开源了具身智能视觉语言模型Pelican-VL 1.0,该模型采用创新的DPPO训练范式,在1000+ A800 GPU集群上训练,性能提升20.3%,超越同类开源模型10.6%,平均性能超过GPT-5和Google Gemini等闭源模型。模型具备强大的多模态理解、时空认知、具身交互和自我纠错能力,为机器人产业提供了可复用的训练范式和开源基础,推动具身智能从实验室走向产业化应用。