SpineGPT脊柱诊疗大模型发布,AI辅助诊断脊柱疾病能力大提升
解放军总医院联合11家顶尖三甲医院和两所重点高校,成功研发出首款脊柱诊疗大模型SpineGPT。该模型基于45万条脊柱指令数据集SpineMed-450K和临床级评估基准SpineBench训练,仅以70亿参数就在各项任务中全面超越顶尖开源大模型,在医疗报告生成任务上表现尤为突出。研究解决了通用AI模型在脊柱诊疗中的'认知鸿沟'问题,为临床级AI应用奠定了坚实基础。
2025宝山智能机器人产业大会:人形机器人科技创新嘉年华开幕
2025年11月21日,宝山智能机器人产业大会在智慧湾科创园盛大开幕,汇聚政府领导、行业专家和企业代表,发布产业行动方案,启动多个重要平台,通过主旨论坛和展览展示,推动智能机器人产业创新发展,为区域经济注入新动能。
核能创新破解AI能耗难题:Valar Atomics引领清洁能源革命
加州初创公司Valar Atomics与阿拉莫斯实验室合作实现"零功率临界"突破,标志着核能技术在解决AI能耗挑战方面取得重要进展。这一里程碑事件展示了新型核能研发模式的可行性,为高能耗行业提供了可持续的清洁能源解决方案,预示着核能技术商业化进程加速。
2025智源具身智能开放日:开源生态驱动机器人模型创新与产业落地
2025年智源具身智能开放日展示了开源生态驱动下的机器人技术创新成果,包括全栈技术架构、模型突破与人机交互升级。行业专家就技术路径与商业化达成共识,强调从可量化单点任务切入,确保投资回报。智源研究院承诺持续推进开源项目,加速技术从实验室向产业转化。
DeepSeek开源LPLB负载均衡器:线性规划优化MoE模型训练GPU效率
DeepSeek开源LPLB负载均衡器,采用线性规划算法优化MoE模型训练过程中的GPU负载分配。该技术通过动态重排序、副本构建和最优分配求解三个步骤,有效解决混合专家模型中的负载不均衡问题,提升训练效率。虽然项目处于早期研究阶段,但为AI训练优化提供了创新的技术思路。
谷歌Nano Banana Pro图像生成模型:Gemini 3驱动高分辨率多语言创意控制
谷歌正式发布Nano Banana Pro(Gemini 3 Pro Image)专业级图像生成模型,深度融合Gemini 3 Pro的强大推理能力,在控制力、文字渲染和世界知识三大方面实现重大突破。支持2K/4K高分辨率、多语言文本生成、14张参考图像融合,并引入SynthID数字水印技术确保内容透明度。该模型面向消费者、专业人士、开发者和创意人士等多个用户群体,通过Gemini API、Google AI Studio和Vertex AI等平台提供服务。
资深技术专家胡成文出任鼎犀智创CTO,共赴新材料智创未来
资深技术专家胡成文出任鼎犀智创CTO,共赴新材料智创未来
亚马逊云科技Kiro正式版发布:AI开发环境升级,提升团队协作与研发效率
亚马逊云科技正式发布AI开发环境Kiro,带来属性测试、检查点回溯、多根工作区支持等核心功能升级,同时推出Kiro命令行界面和企业版订阅方案,全面提升团队在AI研发中的规划、协作与交付效率,为初创企业提供专属优惠支持。
AI教育产业化落地:斑马口语多模态交互与适龄内容实践
2025年AI产业迎来关键转折,斑马口语作为业内首款真正实现AI外教一对一教学的产品,在垂直场景落地中突破四大技术障碍:实时交互速度优化至1.5-2.5秒,语音识别精准度提升,内容输出严格适龄控制,多模态呈现稳定同步。其成功实践重构了口语教育赛道竞争规则,从资源比拼转向AI Agent打造能力竞争,为中国AI产业化提供了可借鉴的范例,证明在技术与产业深度融合中,垂直场景的深度打磨比通用能力展示更具商业价值。
夸克接入千问AI助手,阿里巴巴推出全新Qwen模型浏览器
阿里巴巴完成夸克浏览器与千问AI助手的深度整合,推出基于Qwen大模型的新一代AI浏览器。在全球科技企业竞相布局AI浏览器的背景下,阿里凭借性能全球领先的Qwen系列模型,特别是最新发布的Qwen3-Max旗舰模型,在人工智能浏览器领域确立重要竞争优势。
成本仅0.3美元,耗时26分钟!CudaForge:颠覆性低成本CUDA优化框架
CUDA 代码的性能对于当今的模型训练与推理至关重要,然而手动编写优化 CUDA Kernel 需要很高的知识门槛和时间成本。
AI自主「发现」牛顿第二定律?北大概念驱动型发现系统AI-Newton问世
AI自主「发现」牛顿第二定律?北大概念驱动型发现系统AI-Newton问世
EverMind开源EverMemOS长期记忆系统,AI智能体四层架构突破多场景应用
EverMind团队推出革命性EverMemOS长期记忆操作系统,该系统受人类大脑记忆机制启发,采用四层架构设计,在LoCoMo和LongMemEval-S评测中创下新纪录。作为行业首个同时支持一对一对话和多人协作场景的记忆系统,EverMemOS实现了从记忆存储库到记忆处理器的升级,通过分层记忆提取和模块化框架解决了AI在长时程任务中的记忆断层问题,目前已在GitHub开源,预计年底推出云服务版本。
这届NeurIPS 2025太有看头了!11月22日北京见
2025年,AI 的演进正从“能力突破”迈向“系统构建”阶段。
字节跳动发布Depth Anything 3:简化Transformer实现高效3D视觉建模
字节跳动最新发布的Depth Anything 3(DA3)通过简化Transformer架构实现突破性3D视觉建模,仅使用标准Transformer和单一深度射线表示就在姿态估计和几何估计任务中分别实现44%和25%的性能提升。该技术证明了3D视觉研究可避免过度复杂化设计,具备视频重建、SLAM、3D高斯估计和多摄像头空间感知等多元化应用场景,为自动驾驶、机器人导航等领域提供强大技术支撑。
openEuler发布全球首个超节点操作系统,引领AI算力开源新纪元
2025操作系统大会上,openEuler发布全球首款面向超节点的操作系统,开启AI算力开源新纪元。经过六年发展,开源欧拉社区已成为中国行业数字化转型首选操作系统,预计2025年底装机量突破1600万套。新系统具备全局资源抽象、异构资源融合等核心特性,将推动AI时代算力基础设施革新,加速全球化生态布局。
SIGGRAPH Asia 2025推出PSP框架:AI程序化生成可控3D场景
SIGGRAPH Asia 2025会议上发布的PSP框架革命性地改变了3D场景生成方式,通过让AI输出可执行程序脚本而非直接几何数据,实现了高度可控的场景构建。该框架包含程序化场景描述语言PSDL和智能纠错系统,在测试中显著优于传统方法,用户偏好率高达94.3%,生成速度提升至38秒,为游戏开发、虚拟现实和具身智能等领域提供了全新的技术范式。
北京人形机器人开源Pelican-VL 1.0:DPPO训练突破多模态理解,性能逼近闭源系统
北京人形机器人创新中心开源了具身智能视觉语言模型Pelican-VL 1.0,该模型采用创新的DPPO训练范式,在1000+ A800 GPU集群上训练,性能提升20.3%,超越同类开源模型10.6%,平均性能超过GPT-5和Google Gemini等闭源模型。模型具备强大的多模态理解、时空认知、具身交互和自我纠错能力,为机器人产业提供了可复用的训练范式和开源基础,推动具身智能从实验室走向产业化应用。
Code Arena发布大模型编程新标准:国产GLM-4.6与GPT-5并列榜首
LMArena发布新一代大模型编程评估系统Code Arena,国产模型GLM-4.6与GPT-5、Claude并列榜首,标志着国产大模型在编程领域已达到全球顶尖水平。新评估体系重点关注模型在真实开发环境中的动态编程过程,而GLM-4.6的卓越表现也获得了Cerebras等国际厂商的认可,展现了中国AI技术的快速崛起。
腾讯2025Q3财报:AI生态价值释放,To B业务与云服务强劲增长
腾讯2025年第三季度财报显示总收入1928.7亿元,同比增长15%,其中To B业务表现强劲。AI战略持续深化,混元大模型在多项技术榜单登顶,腾讯元宝打通内部应用生态。云服务与企业需求形成供需共振,带动收入快速增长。研发投入创单季新高达228亿元,云+AI解决方案在医疗、文旅、物流、游戏、教育等多领域落地应用。国际业务成为重要增长引擎,过去三年持续高双位数增长。腾讯将继续加大AI前沿研究,以智能化和国际化驱动业务增长。