第4页|文章博客|AI导航

国产大模型Kimi K2.5发布：开源模型性能对标顶尖闭源，视觉与编程能力全面升级

月之暗面正式发布Kimi K2.5大模型，这是一个拥有1万亿参数的开源MoE模型，在视觉理解、编程能力和智能体协作方面实现重大突破。K2.5在多项评测中性能对标甚至超越顶尖闭源模型，同时成本显著降低。新模型支持图像直接转代码、智能体集群并行处理复杂任务，并推出了Kimi Code编程助手。实测显示其在创意任务、3D重建、语言创造和实用工具开发等方面表现卓越，标志着中国开源大模型技术达到新高度，推动AI向通用人工智能迈进。

AI快讯

2026-01-28

Deep Research多智能体AI系统：实时交互式研究将科学发现周期缩短至分钟级

Deep Research是一个革命性的多智能体AI系统，通过协调、数据分析、文献检索和新颖性检测四大智能体的协同工作，将科学研究周期从小时级缩短至分钟级。系统支持半自主（人机协同）和全自主两种模式，在BixBench基准测试中取得SOTA性能，并已开源其协调框架BioAgents。它代表了AI驱动科研从批处理到实时交互的重大范式转变。

AI快讯

2026-01-28

腾讯AI助手'元宝派'上线，春节红包活动助推社交AI新体验

腾讯于1月26日低调开启其AI助手“元宝”的新功能“元宝派”内测，标志着AI正式深入多人社交场景。该功能允许用户创建或加入兴趣社群，AI不仅能总结聊天、监督打卡，还能进行图片共创。未来将支持“一起看/听”，依托腾讯会议能力实现同步娱乐。腾讯同时宣布投入10亿春节红包为元宝引流，彰显其发力AI社交的决心。此举代表了AI从“效率工具”向“社交伙伴”转型的重要探索，旨在通过真实的群体互动破解用户粘性难题，为行业发展提供新思路。

AI快讯

2026-01-27

AStockArena首期实盘竞技：GPT-5与Claude科创板交易领先，DeepSeek展稳健风控

AStockArena首期实盘竞技结果显示，GPT-5系列与Claude在科创板交易中表现领先，其中GPT-5.1的Alpha收益超过12%。DeepSeek在暴跌行情中展现出卓越的风控能力，证明了国产模型的竞争力。该平台是国内首个采用真实T+1规则的科创板智能体竞技平台，通过ReAct全闭环架构、真实科创板测试场景和专业数据支持，为AI交易模型提供了高拟真的评估环境，推动量化交易进入智能体时代。

AI快讯

2026-01-27

非传统背景人才如何通过个人项目进入OpenAI等顶级AI公司

本文通过OpenAI科学家Noam Brown分享的真实案例，详细阐述了缺乏传统学术背景（如无顶会论文、博士学历或知名导师推荐）的人才，如何通过个人项目进入OpenAI、Google DeepMind等顶级AI公司。文章核心观点是“行动大于资历”，具体路径包括：1）主动联系研究者并改进其已发表工作以获得合作机会；2）发起并彻底公开有影响力的个人开源项目（如NanoGPT优化），用可见成果创造存在感；3）在开源社区（如GitHub）提出深度问题，展示技术洞察力；4）自行发表高质量、设计严谨的独立研究论文；5

AI快讯

2026-01-26

OpenAI战略转型企业市场，应对谷歌Gemini与Anthropic竞争压力

2026年，OpenAI正将其战略重心从消费级产品转向企业级市场，以应对谷歌Gemini和Anthropic日益激烈的竞争。公司通过推出企业一站式AI解决方案、重组销售体系、升级Codex工具等方式，旨在争夺高价值企业客户。市场数据显示，OpenAI的流量份额已从峰值下滑，而竞争对手正快速崛起，促使OpenAI通过深化企业服务寻求新的增长点，目标是将企业收入占比提升至50%。

AI快讯

2026-01-26

OpenAI Codex智能体循环揭秘：提示词缓存与上下文管理驱动自动化开发

本文深度解析了OpenAI Codex智能体循环的核心工作机制，重点阐述了其如何通过Responses API协调用户指令、模型推理与本地工具执行。文章详细介绍了两个关键技术：通过保持提示词前缀一致性实现高效的缓存优化，以及采用自动压缩策略管理上下文窗口。这些机制在确保零数据保留（ZDR）隐私原则的前提下，实现了安全、高效的自动化软件开发。文章还探讨了Codex CLI的架构设计、性能考虑因素以及未来发展方向，为开发者理解和使用AI驱动的代码生成工具提供了全面指导。

AI快讯

2026-01-25

Yann LeCun AMI Labs发布世界模型，挑战大语言模型，估值35亿美元

图灵奖得主Yann LeCun创立的AMI Labs正式公布其核心方向：开发能够理解并模拟现实物理规律的“世界模型”，以此挑战当前主流的大语言模型范式。该公司旨在构建具备理解、记忆、推理规划能力且安全可控的新型AI系统，专注于工业、医疗、机器人等高可靠性领域。与此同时，LeCun的理念也在硅谷另一家公司的能量推理模型中得到体现。该赛道已吸引巨额资本关注，AMI Labs估值或达35亿美元，标志着AI研究正从语言生成向物理世界理解与交互的关键转变。

AI快讯

2026-01-25

VibeTensor与英伟达联手：AI编程重塑深度学习系统开发新纪元

英伟达杰出工程师许冰开源了全球首个完全由AI智能体生成的深度学习系统VibeTensor，该项目从代码到论文无一出自人类之手，标志着生成式软件工程时代的到来。VibeTensor具备完整的全栈架构，包括创新的Fabric张量系统和强大的AI内核套件，但也揭示了当前AI编程的‘弗兰肯斯坦效应’——局部正确但全局效率瓶颈。该项目验证了AI构建复杂系统代码的能力，被视为AI编程领域的‘AlphaGo时刻’，预示了未来软件开发范式将从人类编写转向AI自主生成的革命性变革。

AI快讯

2026-01-24

OpenAI：以后大家用AI赚的钱，我可能要抽成

AI快讯

2026-01-24

Transformer架构创新：刘壮团队提出无归一化Derf模型，推动深度学习发展

刘壮研究团队提出了一种名为Derf（Dynamic erf）的新型激活层，成功构建了无需传统层归一化（LayerNorm）的Transformer模型。Derf结构简单，可直接替换归一化层，在ImageNet分类、DiT图像生成、语音识别、DNA序列建模及语言模型等多个任务上，其性能均持平或超越了传统方案，且优势主要源于更好的模型泛化能力。这一突破为开发更高效、性能更强的无归一化深度学习模型提供了关键技术支持。

AI快讯

2026-01-23

百川智能发布Baichuan-M3 Plus医疗大模型：低幻觉率+免费API加速AI医疗落地

百川智能发布新一代医疗大模型Baichuan-M3 Plus，该模型通过Fact-Aware RL和六源循证等技术，实现了全球领先的低幻觉率（仅2.6），并首创“证据锚定”技术确保每个医学判断都可追溯。同时，公司启动“海纳百川”计划，向医疗服务机构免费开放API，并结合Gated Eagle-3框架等工程优化，将调用成本降低70%，旨在以高准确性、高可及性推动AI辅助医疗的普及与落地。

AI快讯

2026-01-23

非Transformer架构的新突破，液态神经网络的推理小模型只用900M内存

AI快讯

2026-01-22

京东AI购物助手上线：对话式交互重构智能电商体验

京东正式推出独立AI购物应用“京东AI购”，通过一个简洁的对话界面，彻底重构了电商体验。该应用核心在于兼容“快思考”与“慢思考”两种用户决策模式：既能通过自然对话理解模糊的复杂需求（如新手观鸟装备），提供一站式解决方案；也能在目标明确时，通过智能导购式筛选快速锁定商品。一个始终驻留在页面底部的对话框，允许用户在浏览任何商品时随时提问，由AI自动从海量信息中提取答案。这款应用是京东在电商决策环节的一次深度探索，它作为独立的“概念旗舰店”，旨在验证从“货架”到“智能代理人”的未来电商形态，背后则完全依托京东成

AI快讯

2026-01-22

马斯克开源X平台推荐算法，Transformer架构提升透明度与内容质量

埃隆·马斯克旗下X平台（原Twitter）正式开源其核心“For You”信息流推荐算法，该算法采用与xAI的Grok模型同源的Transformer架构。这一开创性举措旨在提升平台透明度，回应监管压力。开源代码揭示了由Thunder和Phoenix两大组件构成的系统：Thunder负责实时处理关注网络内容，Phoenix则通过双塔模型召回及基于Grok的Transformer模型进行精细排序，预测用户十几种互动行为的概率。分析表明，新算法逻辑正从追求短期热度转向优化长期关系与内容质量，深度互动和用户关系

AI快讯

2026-01-21

MiniMax发布Agent 2.0：AI原生工作台重塑工作流，生产力再升级

MiniMax正式发布Agent 2.0，将其定义为“AI原生工作台”，标志着智能体从对话工具向实干伙伴的深刻转变。该版本以三大核心支柱重构产品：深度打通本地环境的桌面端应用、可达到领域顶尖水平的Expert Experts专家智能体、以及高度自定义的专属Agent创建能力。通过多个实战场景测试，Agent 2.0展现出在自动化信息处理、复杂技术分析、海量文件整理、本地工具链调用及多专家团队调度方面的强大执行力。其背后是MiniMax在底层模型技术上的持续迭代，以及将AI深度应用于内部工作所形成的快速优化

AI快讯

2026-01-21

DeepSeek mHC超连接架构创新：Sinkhorn算法提升AI模型稳定性与复现验证

DeepSeek提出的mHC架构通过Sinkhorn算法将混合矩阵约束为双随机形式，成功解决了超连接在大规模训练中的信号爆炸问题。独立复现实验显示，在17亿参数规模下，传统HC架构信号放大达10924倍，而mHC始终保持稳定。这项创新不仅增强了模型表达能力，更为AI模型的规模化训练提供了关键的稳定性保障，代表了Transformer架构演进的重要方向。

AI快讯

2026-01-20

Claude加速科研：AI在生命科学与基因研究的自动化突破

本文介绍了Anthropic公司推出的Claude for Life Sciences如何通过AI技术驱动生命科学研究的自动化突破。文章重点展示了三个前沿实验室的应用案例：斯坦福大学的Biomni平台整合数百种工具，将GWAS分析从数月缩短至20分钟；MIT Cheeseman实验室利用AI自动化解读海量基因敲除数据，解放科学家于繁重的文献分析；斯坦福Lundberg实验室则用AI构建分子关系图谱，实现从“经验猜谜”到理性靶向的假设生成革命。这些案例表明，Claude AI正在超越基础辅助功能，深度重塑科

AI快讯

2026-01-20

AAAI 2026新加坡AI周：人类自主权与Agentic AI前沿研讨会聚焦

AAAI 2026新加坡AI周期间将举办两场前沿研讨会：第一场聚焦AI时代如何捍卫人类在工作、学习、拥有与选择方面的自主权，汇聚全球治理与技术专家；第二场深入探讨基于大语言模型的Agentic AI、自主智能体与多智能体系统的技术融合、挑战与未来方向。两场活动均在新加坡国立大学举行，邀请多位国际顶尖学者分享，是了解AI伦理治理与智能体技术最新进展的宝贵平台。

AI快讯

2026-01-19

生成式AI语音助手在智能家居中的可靠性挑战与用户体验优化

本文探讨了生成式AI语音助手（如Alexa Plus）在智能家居应用中面临的可靠性挑战。文章通过记者与咖啡机的真实互动案例，揭示了LLM固有的随机性与家居控制所需的确定性之间的根本矛盾。尽管新技术在理解复杂指令、实现多设备协同和提供智能通知方面潜力巨大，但在执行开灯、煮咖啡等基础指令时却频频出错，引发用户不满。分析指出，问题核心在于技术边界模糊，当前将生成式AI置于核心控制位置可能为时过早。文章认为，未来的优化方向应是明确AI的辅助角色，将其作为增强理解的交互层，而非完全替代稳定可靠的传统控制逻辑，从而在

AI快讯

2026-01-19