腾讯加速AI布局:混元大模型开源,推动智能体与应用落地

12月17日,一则来自行业媒体机器之心的报道引发了广泛关注:前OpenAI研究员、清华大学杰出校友姚顺雨(Vinces Yao)已正式加盟腾讯,担任“CEO/总裁办公室”首席AI科学家一职,并将直接向集团总裁刘炽平汇报。这位在思维树(ToT)、ReAct等前沿研究方向有着突破性贡献的青年科学家,他的加入无疑为腾讯的AI研发注入了强大的前沿理论动力。

与高端人才引进同步进行的,是研发体系的全面升级。腾讯宣布成立AI Infra部、AI Data部及数据计算平台部,旨在从基础设施、数据治理到计算平台等多个维度,构筑更坚实、更高效的AI研发底座。更为引人注目的是,腾讯在同一天重磅发布并开源了“混元世界模型1.5(WorldPlay)”,这被认为是国内首个具备实时交互能力的同类模型,标志着其在生成式AI与虚拟世界构建领域迈出了关键一步。
如果将视野放得更远,不难发现腾讯在AI领域的积累已形成一股强劲的势头:从采用混合专家(MoE)架构、在推理效率上领先的混元大模型2.0,到全球下载量突破300万、备受开发者欢迎的混元3D系列模型,再到腾讯混元、腾讯优图实验室持续贡献的一系列开源模型与工具,其在技术迭代速度、开源生态建设以及人才团队实力上的提升有目共睹。
姚顺雨曾在其个人论述中深入探讨过AI发展的“下半场”,着重强调了智能体(Agent)与认知架构的核心地位。如今,随着他的加盟并统筹AI基础设施与大语言模型两大核心部门,腾讯AI的战略蓝图愈发清晰:致力于将顶尖的学术研究与扎实的工程实践深度融合,最终目标是打造真正实用、好用的AI产品与服务。
筑牢基石:持续进化的模型能力
任何上层应用的繁荣与创新,都离不开底层基础模型的强大支撑。在此次架构调整中,新设立的AI Infra部被赋予了构建大规模分布式训练、高性能推理服务等核心能力的重任,其战略地位不言而喻。
在模型能力层面,腾讯混元大模型家族展现了强大的进化能力。最新推出的混元2.0在复杂指令理解与文本创作任务上已达到国内领先水平。而在3D内容生成这一热门赛道,腾讯混元3D系列模型已成为全球最受欢迎的开源3D模型之一,累计社区下载量超过300万次。其最新迭代版本混元3D 3.0,更是将三维建模的精度提升了惊人的3倍。
姚顺雨的独特价值在于,他不仅带来了算法研究的前沿视角,更关键的是他将同时负责模型与基础设施(Infra)。这种“模型+基建”的一体化统筹管理模式,有望从根本上加强算法创新与底层算力资源之间的协同与融合。一方面,基础设施能够更灵活地适配模型演进的前沿需求;另一方面,模型训练也能更高效地利用庞大的计算资源。这种深层次的协同,无疑让业界对混元大语言模型未来的进化速度与性能上限抱有更高期待。
贯通血脉:模型与工程的深度协同
如果说持续进化的大模型是驱动AI应用的“强劲心脏”,那么要让AI能力真正在复杂的业务场景中顺畅运行,则离不开一套精密、可靠的“骨骼与血脉”系统——即强大的工程化能力。
腾讯正通过从底层模型、中间件工具到上层应用平台的完整布局,系统性地弥合技术突破与产业落地之间的鸿沟。工程化能力首先体现在对底层算力基础设施的极致优化上。据悉,腾讯通过软硬件一体化的深度调优策略,对其星脉网络与高性能存储系统进行了专项优化,使得大规模模型训练的综合性能提升了30%。
同时,腾讯云将支撑内部超大规模模型训练的技术能力沉淀为“TI平台”,核心目标是解决企业用户在模型训练中“训不动、调不准”的普遍性工程难题。该平台不仅支持灵活的算力资源调度,更实现了从数据预处理、模型训练、精调优化到服务部署的全链路自动化。无论是汽车行业需要对模型进行领域适配,还是金融客户要求私有化部署,腾讯云TI平台都能提供标准化、工业级的“生产流水线”,让大模型开发也能像传统软件工程一样可控、可靠。
在夯实了底层平台之后,腾讯优图实验室等团队贡献了一系列“小而美”的开源模型组件,旨在精准解决大模型落地中的具体痛点。这些开源项目并非孤立的技术演示,而是构成了一个具备高度协同性的技术栈,通过模块化的集成,能够形成从点到面的体系化解决方案。
例如,针对AI理解复杂文档的难题,腾讯优图实验室即将开源“Youtu-Parsing”模型。它如同一位经验丰富的文档分析师,能够对排版复杂、结构各异的非结构化文档(如研究报告、财务报表、学术论文等)进行从全局布局到局部元素的精细化解析,精准提取其中的文本、图表、表格、公式等关键信息,从而为上层大模型提供高质量、结构化的输入数据。
针对大模型常见的“记忆短暂”和“事实幻觉”问题,腾讯此前已开源了“Youtu-embedding”和“Youtu-graphrag”组合工具。前者为AI提供了在海量知识库中快速精准检索信息的能力;后者则利用知识图谱技术,将碎片化的信息点连接成有逻辑的知识网络,相当于为AI装配了“推理地图”,使其回答有据可查,大幅减少“信口开河”的情况。
为了突破传统对话AI的局限,让AI能够自主规划并执行复杂任务序列,腾讯优图实验室还开源了“Youtu-agent”智能体框架。该框架设计之初就内置了“自我进化”机制,能够根据自然语言描述,自动创建任务所需的工具并配置相应的智能体。它提供了两种强化学习优化方案:一种支持对开发者构建的智能体进行端到端的训练;另一种则更为轻量,无需重新训练,仅通过引入“练习经验”就能提升智能体的表现。该框架在WebWalkerQA、GAIA等权威评测中,基于开源模型取得了领先(SOTA)的成绩,证明了其强大的研究与应用潜力。

这些扎实的模型与工具,最终在平台层面得到了完美的汇聚与承接。今年年中,腾讯云正式推出了智能体开发平台(ADP)。该平台深度融合了腾讯混元大模型的底层能力以及优图等实验室的前沿算法,允许企业用户无需组建庞大的算法团队,仅通过直观的“拖拉拽”式低代码操作,就能在几分钟内快速构建出专属的智能客服、数据分析师或编程助手。最新版本的ADP进一步增强了其连接能力,支持对接企业现有的第三方数据库与工作流系统,并新增了应用效果评测工具,持续降低企业构建和部署AI应用的技术门槛与试错成本。
创造价值:AI应用落地生根,遍地开花
技术的加速最终要服务于价值的创造。在“前沿研究”与“扎实工程”双轮驱动下,腾讯的AI能力正在金融、传媒、零售、能源、医疗等多个垂直行业实现规模化落地,并产生了切实的效益。
- 金融保险:东吴人寿利用腾讯云ADP平台构建了公司级智能体开发平台“东吴天枢”,成功打造了智能客服、理赔助手等多个智能体应用。其中,“苏惠保智能快赔助手”将理赔处理时效从传统人工模式的3-5天,缩短至惊人的3分钟以内,预计每年可高效处理上万起理赔案件,在提升客户体验的同时,显著降低了运营成本。
- 媒体内容:广东广播电视台基于腾讯云ADP打造了“AI内容服务平台”,用于快速处理海量直播素材、智能生成新闻稿件与短视频。以往需要编辑花费几十分钟完成的视频剪辑工作,现在最快可压缩到几分钟内完成。在今年全运会报道期间,该平台累计辅助生产了上百条爆款内容,整体内容生产效率提升了约40%。
- 零售营销:绝味食品通过腾讯云智能体开发平台构建了营销云智能体。数据显示,由该智能体策划并推送的营销活动,其内容点击率比人工专家团队高出40%,最终支付转化率达到人工组的2.4倍,产生的交易金额更是人工组的3.1倍。
- 能源制造:针对电网设备分布广泛、传统人工巡检效率低、风险高的痛点,腾讯协助训练的电力视觉大模型在多种复杂场景下均表现出高精度的缺陷检出率和良好的泛化能力,为保障电网安全稳定运行提供了有力的AI支持。
- 医疗健康:在腾讯健康小程序中,AI健康管理助手已能够自动解读用户的体检报告,深入浅出地解析各项异常指标的含义,并基于个人健康状况生成定制化的健康改善计划,让专业的健康管理服务变得更具可及性和温度。
从底层的组织架构与人才战略调整,到中台的工具链开源与平台化建设,再到上层与千行百业结合的规模化应用,腾讯正在精心构建一个环环相扣、紧密咬合的AI生态飞轮。
当然,按下加速键绝不意味着竞赛的终点。整个行业已形成共识:人工智能的发展是一场考验耐力与毅力的“马拉松”。对腾讯而言,挑战依然清晰:如何在庞大的组织体量下保持初创公司般的创新敏捷性?如何在追求工程化落地确定性的同时,为高度不确定的前沿探索保留足够的空间与资源?
这些问题,或许只有时间才能给出最终的答案。但可以肯定的是,腾讯已经以更清晰的战略、更坚决的姿态,奔跑在了这条漫长的赛道上。
想获取更多AI最新资讯与智能工具推荐, 欢迎访问 👉 AI Tools Nav ——优质的 AI导航平台 与 AI学习社区
本文来源:机器之心
原文链接:https://www.jiqizhixin.com/articles/133a3478-cee9-4aef-b8f5-567390aed4bc