AI快讯
Code Arena发布大模型编程新标准:国产GLM-4.6与GPT-5并列榜首
LMArena发布新一代大模型编程评估系统Code Arena,国产模型GLM-4.6与GPT-5、Claude并列榜首,标志着国产大模型在编程领域已达到全球顶尖水平。新评估体系重点关注模型在真实开发环境中的动态编程过程,而GLM-4.6的卓越表现也获得了Cerebras等国际厂商的认可,展现了中国AI技术的快速崛起。
腾讯2025Q3财报:AI生态价值释放,To B业务与云服务强劲增长
腾讯2025年第三季度财报显示总收入1928.7亿元,同比增长15%,其中To B业务表现强劲。AI战略持续深化,混元大模型在多项技术榜单登顶,腾讯元宝打通内部应用生态。云服务与企业需求形成供需共振,带动收入快速增长。研发投入创单季新高达228亿元,云+AI解决方案在医疗、文旅、物流、游戏、教育等多领域落地应用。国际业务成为重要增长引擎,过去三年持续高双位数增长。腾讯将继续加大AI前沿研究,以智能化和国际化驱动业务增长。
AI驱动LDBT范式重构生物设计:机器学习优化蛋白质合成
美国多所顶尖大学联合提出LDBT新范式,通过将机器学习前置重构传统生物设计流程。该创新方法利用蛋白质语言模型和深度学习技术,将设计成功率提升10倍,结合无细胞表达系统实现高通量研发,为合成生物学和蛋白质工程带来革命性突破。
AAAI 2026视频扩散模型:基于物理直觉生成科学现象的潜在知识探索
东方理工与上海交大联合团队在AAAI 2026发表创新研究,提出潜在知识引导的视频扩散框架,突破性地实现从单帧图像生成符合物理规律的科学现象演化过程。该方法通过静态特征解析、动态趋势预测和跨模态知识转换三重机制,为生成式AI注入物理直觉,在流体模拟和台风预测任务中显著提升生成质量,标志着AI从视觉生成向科学生成的重要转变。
豆包编程模型:256K长上下文+Agentic Coding,火山引擎高性价比AI编程助手
火山引擎推出的豆包编程模型Doubao-Seed-Code是一款专为编程任务设计的AI助手,具备原生256K长上下文处理能力和视觉理解功能,在多项权威评测中表现优异。该模型通过大规模强化学习训练获得强大的智能编码能力,能够自主规划并执行复杂多步骤任务,包括代码重构、跨语言项目移植和实际问题解决。配合亲民的价格策略和良好的API兼容性,为开发者提供了高性价比的智能编程解决方案,是现有智能编码工具的理想替代选择。
火山引擎发布豆包AI编程模型,成本降低50%助力开发效率提升
火山引擎双十一期间推出豆包AI编程模型,通过分层定价和全量透明缓存技术实现成本降低62.7%,具备视觉理解能力和256K长上下文处理特性,在SWE-Bench测试中以78.8%得分创行业新高,现通过火山方舟平台开放API并推出首月9.9元优惠套餐。
MPI首创自动化叶绿体合成平台,推动可编程作物与农业革命
德国马克斯·普朗克研究所开发出全球首个自动化叶绿体合成平台,通过模块化设计和高通量筛选技术,能够快速构建测试数百种基因组合,显著提升叶绿体工程效率。该技术成功实现微藻生物量翻倍,为开发耐逆性强、产量高的可编程作物奠定基础,有望引领新一轮农业技术革命。
AtomWorld材料建模基准测试发布,标准化大模型原子级空间推理评估
AtomWorld材料建模基准测试由中国科学技术大学苏州高等研究院与新南威尔士大学等机构联合发布,首次构建了针对大语言模型原子级空间推理能力的标准化评估体系。该测试通过10类核心原子操作任务,系统评估模型在三维原子结构编辑中的表现,填补了该领域评测空白,同时兼具数据生成功能,为大模型在材料科学中的优化和应用提供重要支撑。
HuggingFace发布200页大模型训练实战指南:从架构到部署全解析,SmolLM3案例详解
HuggingFace发布的200页大模型训练实战指南,基于384块H100 GPU训练SmolLM3的实践经验,系统性地分享了从训练决策、架构设计、数据管理到长周期训练、后处理优化和基础设施建设的完整技术路线,为大语言模型开发提供了端到端的实战解决方案。
百度文心5.0 Preview LMArena全球第二,创意写作与复杂理解领先
百度文心5.0 Preview在LMArena全球大模型评测中取得突破性成绩,位列全球第二、国内第一,在创意写作、复杂问题理解和指令遵循等核心能力上表现卓越。这一成就背后是百度『芯片-框架-模型-应用』四层全栈技术布局的有力支撑,标志着中国AI技术正从追赶迈向引领的新阶段。