国产大模型Kimi K2.5发布:开源模型性能对标顶尖闭源,视觉与编程能力全面升级
月之暗面正式发布Kimi K2.5大模型,这是一个拥有1万亿参数的开源MoE模型,在视觉理解、编程能力和智能体协作方面实现重大突破。K2.5在多项评测中性能对标甚至超越顶尖闭源模型,同时成本显著降低。新模型支持图像直接转代码、智能体集群并行处理复杂任务,并推出了Kimi Code编程助手。实测显示其在创意任务、3D重建、语言创造和实用工具开发等方面表现卓越,标志着中国开源大模型技术达到新高度,推动AI向通用人工智能迈进。
Deep Research多智能体AI系统:实时交互式研究将科学发现周期缩短至分钟级
Deep Research是一个革命性的多智能体AI系统,通过协调、数据分析、文献检索和新颖性检测四大智能体的协同工作,将科学研究周期从小时级缩短至分钟级。系统支持半自主(人机协同)和全自主两种模式,在BixBench基准测试中取得SOTA性能,并已开源其协调框架BioAgents。它代表了AI驱动科研从批处理到实时交互的重大范式转变。
腾讯AI助手'元宝派'上线,春节红包活动助推社交AI新体验
腾讯于1月26日低调开启其AI助手“元宝”的新功能“元宝派”内测,标志着AI正式深入多人社交场景。该功能允许用户创建或加入兴趣社群,AI不仅能总结聊天、监督打卡,还能进行图片共创。未来将支持“一起看/听”,依托腾讯会议能力实现同步娱乐。腾讯同时宣布投入10亿春节红包为元宝引流,彰显其发力AI社交的决心。此举代表了AI从“效率工具”向“社交伙伴”转型的重要探索,旨在通过真实的群体互动破解用户粘性难题,为行业发展提供新思路。
AStockArena首期实盘竞技:GPT-5与Claude科创板交易领先,DeepSeek展稳健风控
AStockArena首期实盘竞技结果显示,GPT-5系列与Claude在科创板交易中表现领先,其中GPT-5.1的Alpha收益超过12%。DeepSeek在暴跌行情中展现出卓越的风控能力,证明了国产模型的竞争力。该平台是国内首个采用真实T+1规则的科创板智能体竞技平台,通过ReAct全闭环架构、真实科创板测试场景和专业数据支持,为AI交易模型提供了高拟真的评估环境,推动量化交易进入智能体时代。
非传统背景人才如何通过个人项目进入OpenAI等顶级AI公司
本文通过OpenAI科学家Noam Brown分享的真实案例,详细阐述了缺乏传统学术背景(如无顶会论文、博士学历或知名导师推荐)的人才,如何通过个人项目进入OpenAI、Google DeepMind等顶级AI公司。文章核心观点是“行动大于资历”,具体路径包括:1)主动联系研究者并改进其已发表工作以获得合作机会;2)发起并彻底公开有影响力的个人开源项目(如NanoGPT优化),用可见成果创造存在感;3)在开源社区(如GitHub)提出深度问题,展示技术洞察力;4)自行发表高质量、设计严谨的独立研究论文;5
OpenAI战略转型企业市场,应对谷歌Gemini与Anthropic竞争压力
2026年,OpenAI正将其战略重心从消费级产品转向企业级市场,以应对谷歌Gemini和Anthropic日益激烈的竞争。公司通过推出企业一站式AI解决方案、重组销售体系、升级Codex工具等方式,旨在争夺高价值企业客户。市场数据显示,OpenAI的流量份额已从峰值下滑,而竞争对手正快速崛起,促使OpenAI通过深化企业服务寻求新的增长点,目标是将企业收入占比提升至50%。
OpenAI Codex智能体循环揭秘:提示词缓存与上下文管理驱动自动化开发
本文深度解析了OpenAI Codex智能体循环的核心工作机制,重点阐述了其如何通过Responses API协调用户指令、模型推理与本地工具执行。文章详细介绍了两个关键技术:通过保持提示词前缀一致性实现高效的缓存优化,以及采用自动压缩策略管理上下文窗口。这些机制在确保零数据保留(ZDR)隐私原则的前提下,实现了安全、高效的自动化软件开发。文章还探讨了Codex CLI的架构设计、性能考虑因素以及未来发展方向,为开发者理解和使用AI驱动的代码生成工具提供了全面指导。
Yann LeCun AMI Labs发布世界模型,挑战大语言模型,估值35亿美元
图灵奖得主Yann LeCun创立的AMI Labs正式公布其核心方向:开发能够理解并模拟现实物理规律的“世界模型”,以此挑战当前主流的大语言模型范式。该公司旨在构建具备理解、记忆、推理规划能力且安全可控的新型AI系统,专注于工业、医疗、机器人等高可靠性领域。与此同时,LeCun的理念也在硅谷另一家公司的能量推理模型中得到体现。该赛道已吸引巨额资本关注,AMI Labs估值或达35亿美元,标志着AI研究正从语言生成向物理世界理解与交互的关键转变。
VibeTensor与英伟达联手:AI编程重塑深度学习系统开发新纪元
英伟达杰出工程师许冰开源了全球首个完全由AI智能体生成的深度学习系统VibeTensor,该项目从代码到论文无一出自人类之手,标志着生成式软件工程时代的到来。VibeTensor具备完整的全栈架构,包括创新的Fabric张量系统和强大的AI内核套件,但也揭示了当前AI编程的‘弗兰肯斯坦效应’——局部正确但全局效率瓶颈。该项目验证了AI构建复杂系统代码的能力,被视为AI编程领域的‘AlphaGo时刻’,预示了未来软件开发范式将从人类编写转向AI自主生成的革命性变革。
Transformer架构创新:刘壮团队提出无归一化Derf模型,推动深度学习发展
刘壮研究团队提出了一种名为Derf(Dynamic erf)的新型激活层,成功构建了无需传统层归一化(LayerNorm)的Transformer模型。Derf结构简单,可直接替换归一化层,在ImageNet分类、DiT图像生成、语音识别、DNA序列建模及语言模型等多个任务上,其性能均持平或超越了传统方案,且优势主要源于更好的模型泛化能力。这一突破为开发更高效、性能更强的无归一化深度学习模型提供了关键技术支持。
百川智能发布Baichuan-M3 Plus医疗大模型:低幻觉率+免费API加速AI医疗落地
百川智能发布新一代医疗大模型Baichuan-M3 Plus,该模型通过Fact-Aware RL和六源循证等技术,实现了全球领先的低幻觉率(仅2.6),并首创“证据锚定”技术确保每个医学判断都可追溯。同时,公司启动“海纳百川”计划,向医疗服务机构免费开放API,并结合Gated Eagle-3框架等工程优化,将调用成本降低70%,旨在以高准确性、高可及性推动AI辅助医疗的普及与落地。
京东AI购物助手上线:对话式交互重构智能电商体验
京东正式推出独立AI购物应用“京东AI购”,通过一个简洁的对话界面,彻底重构了电商体验。该应用核心在于兼容“快思考”与“慢思考”两种用户决策模式:既能通过自然对话理解模糊的复杂需求(如新手观鸟装备),提供一站式解决方案;也能在目标明确时,通过智能导购式筛选快速锁定商品。一个始终驻留在页面底部的对话框,允许用户在浏览任何商品时随时提问,由AI自动从海量信息中提取答案。这款应用是京东在电商决策环节的一次深度探索,它作为独立的“概念旗舰店”,旨在验证从“货架”到“智能代理人”的未来电商形态,背后则完全依托京东成
马斯克开源X平台推荐算法,Transformer架构提升透明度与内容质量
埃隆·马斯克旗下X平台(原Twitter)正式开源其核心“For You”信息流推荐算法,该算法采用与xAI的Grok模型同源的Transformer架构。这一开创性举措旨在提升平台透明度,回应监管压力。开源代码揭示了由Thunder和Phoenix两大组件构成的系统:Thunder负责实时处理关注网络内容,Phoenix则通过双塔模型召回及基于Grok的Transformer模型进行精细排序,预测用户十几种互动行为的概率。分析表明,新算法逻辑正从追求短期热度转向优化长期关系与内容质量,深度互动和用户关系
MiniMax发布Agent 2.0:AI原生工作台重塑工作流,生产力再升级
MiniMax正式发布Agent 2.0,将其定义为“AI原生工作台”,标志着智能体从对话工具向实干伙伴的深刻转变。该版本以三大核心支柱重构产品:深度打通本地环境的桌面端应用、可达到领域顶尖水平的Expert Experts专家智能体、以及高度自定义的专属Agent创建能力。通过多个实战场景测试,Agent 2.0展现出在自动化信息处理、复杂技术分析、海量文件整理、本地工具链调用及多专家团队调度方面的强大执行力。其背后是MiniMax在底层模型技术上的持续迭代,以及将AI深度应用于内部工作所形成的快速优化
DeepSeek mHC超连接架构创新:Sinkhorn算法提升AI模型稳定性与复现验证
DeepSeek提出的mHC架构通过Sinkhorn算法将混合矩阵约束为双随机形式,成功解决了超连接在大规模训练中的信号爆炸问题。独立复现实验显示,在17亿参数规模下,传统HC架构信号放大达10924倍,而mHC始终保持稳定。这项创新不仅增强了模型表达能力,更为AI模型的规模化训练提供了关键的稳定性保障,代表了Transformer架构演进的重要方向。
Claude加速科研:AI在生命科学与基因研究的自动化突破
本文介绍了Anthropic公司推出的Claude for Life Sciences如何通过AI技术驱动生命科学研究的自动化突破。文章重点展示了三个前沿实验室的应用案例:斯坦福大学的Biomni平台整合数百种工具,将GWAS分析从数月缩短至20分钟;MIT Cheeseman实验室利用AI自动化解读海量基因敲除数据,解放科学家于繁重的文献分析;斯坦福Lundberg实验室则用AI构建分子关系图谱,实现从“经验猜谜”到理性靶向的假设生成革命。这些案例表明,Claude AI正在超越基础辅助功能,深度重塑科
AAAI 2026新加坡AI周:人类自主权与Agentic AI前沿研讨会聚焦
AAAI 2026新加坡AI周期间将举办两场前沿研讨会:第一场聚焦AI时代如何捍卫人类在工作、学习、拥有与选择方面的自主权,汇聚全球治理与技术专家;第二场深入探讨基于大语言模型的Agentic AI、自主智能体与多智能体系统的技术融合、挑战与未来方向。两场活动均在新加坡国立大学举行,邀请多位国际顶尖学者分享,是了解AI伦理治理与智能体技术最新进展的宝贵平台。
生成式AI语音助手在智能家居中的可靠性挑战与用户体验优化
本文探讨了生成式AI语音助手(如Alexa Plus)在智能家居应用中面临的可靠性挑战。文章通过记者与咖啡机的真实互动案例,揭示了LLM固有的随机性与家居控制所需的确定性之间的根本矛盾。尽管新技术在理解复杂指令、实现多设备协同和提供智能通知方面潜力巨大,但在执行开灯、煮咖啡等基础指令时却频频出错,引发用户不满。分析指出,问题核心在于技术边界模糊,当前将生成式AI置于核心控制位置可能为时过早。文章认为,未来的优化方向应是明确AI的辅助角色,将其作为增强理解的交互层,而非完全替代稳定可靠的传统控制逻辑,从而在