百川智能发布Baichuan-M3 Plus医疗大模型:低幻觉率+免费API加速AI医疗落地

AI快讯 2026-01-23

百川智能发布Baichuan-M3 Plus医疗大模型:以极低幻觉率与免费API加速AI医疗普及

在医疗健康这一对准确性要求近乎苛刻的领域,人工智能大模型正经历一场深刻的变革:从早期的“天马行空”式生成,进化到如今严谨、可靠且具备强大检索与推理能力的新阶段。近日,百川智能发布的新一代医疗大模型Baichuan-M3 Plus,正是这一变革中的里程碑式产品。

本周四,百川智能正式推出面向医疗应用开发者的Baichuan-M3 Plus模型。该模型在真实医学场景下的问题推理能力达到了全新高度,标志着AI辅助医疗跨过了“敢用、好用、用得起”的关键门槛。伴随模型发布,集成M3 Plus能力的“百小应”App及网页版也已同步上线。

百川智能创始人兼CEO王小川将M3 Plus定位为“医生版的ChatGPT或DeepSeek”。他认为,作为当前性能最强、推理效率最高的医疗垂直模型,M3 Plus有能力推动AI辅助医疗的大规模落地应用。

攻克核心痛点:实现全球领先的低幻觉率

长久以来,医疗从业者对AI又爱又惧:既期待其能分担繁重工作,又担忧其“一本正经地胡说八道”可能带来的风险。建立信任,是AI进入严肃医疗场景必须翻越的最后一道高墙。

百川智能模型技术负责人鞠强在发布会上分享了一个典型案例:一位医生曾尝试用某AI工具核查一种肿瘤药物的不良反应,结果发现生成内容看似专业、引文规范,但深入核验后,竟有高达90%的信息存在谬误。这种“貌似正确”的幻觉,其隐蔽性和危害性甚至超过直接答错。

为根治这一顽疾,M3 Plus继承了其基座模型Baichuan-M3的核心技术——Fact-Aware RL(事实感知强化学习)。该技术将模型生成的文本拆解为一条条可独立核查的医学判断,并与权威医学知识源进行逐条比对,从而量化并提升生成内容的事实准确性。测试表明,Baichuan-M3在医疗沟通与推理能力上已全面超越GPT-5.2,并实现了全球最低的医疗幻觉率。

此外,M3 Plus还深度融合了“六源循证”(EAR)方法。该方法将循证医学的严谨范式引入大模型的训练与推理流程,确保模型的每一条建议都有坚实的医学证据支撑。通过将用户查询转化为结构化医学问题,并在分层构建的“六源”数据库中进行精准匹配,该方法有效克服了通用检索增强生成(RAG)技术在医学语义理解和文献可靠性方面的不足。据悉,该技术已将模型的幻觉率降至DeepSeek-R1模型的三分之一,其可信度可比肩资深临床专家。

在权威的Hallucination Rate评测中,M3 Plus的幻觉率仅为2.6,较GPT-5.2低30%以上,也低于当前行业标杆OpenEvidence,刷新了医疗大模型低幻觉率的世界纪录。

首创“证据锚定”:让每个判断都可追溯、可核验

“核验AI给出的回答,有时比自己查文献还累。”这是许多医生试用通用大模型后的共同感受。在医疗领域,引用的准确性是可信度的基石,然而AI生成内容与引用证据之间“张冠李戴”的问题一直缺乏系统性的解决方案。

为此,百川智能首创了“证据锚定”(Evidence Anchoring)技术。该技术将引用准确性作为一个独立且核心的训练目标进行系统化建模。AI不再仅仅是笼统地标注文献来源,而是被要求其生成的每一句医学结论,都必须精确对应到原始论文或指南中的具体证据段落,实现逐字溯源、逐句核验。

结合专门训练的“引用奖励模型”(Citation Reward Model)对错误引用进行惩罚,M3 Plus被约束在“确有证据支持”的范围内进行推理与生成。最终,其结论与证据段落的匹配准确率超过了95%,真正实现了医学判断的可核验、可追责、可教学,将验证信息源的主动权交还给了医生。

“海纳百川”计划:以免费开放推动生态共荣

在海外,如OpenEvidence这样的AI医学助手已覆盖近半数医生,但其高昂的订阅费用在现阶段的中国市场难以推广。中国医生日均接诊量远超海外同行,让AI工具普及的前提是不能增加其经济负担。

百川智能给出了一个大胆的解决方案——启动“海纳百川”计划。该计划面向所有服务于医务工作者的机构,免费提供经过循证增强的M3 Plus模型API。百川希望通过此举,催化更多服务于临床的AI应用诞生,让更多医生能用上、用好AI工具,进而推动整个医疗行业的进步。目前,所有开发者均可申请为期15天的API限时免费体验。

王小川算了一笔账:即使全中国的临床医生都使用M3 Plus,其一年的成本也大约在1亿元人民币左右。百川愿意承担这笔费用,以培育和催熟整个医疗AI生态。

极致工程优化:实现高性能与低成本的统一

在技术实现层面,M3 Plus围绕医疗场景进行了系统的工程重构,在保障能力与可靠性的前提下,将API调用成本较上一代降低了70%。

这主要得益于两项关键优化:

  1. Gated Eagle-3投机解码框架:通过门控注意力机制,使草案模型能“有选择地”吸收主模型的语义指导,显著提升预测准确率。这好比一位教授带着一位更聪明的助教撰写诊断书,助教能精准领会意图,快速产出高质量草稿,教授只需做关键修正,从而大幅提升效率。在相同配置下,其推理吞吐量较原始Eagle-3提升约15%。
  2. 面向医学MoE模型的极致量化:针对混合专家模型的稀疏激活特性,设计了定制化的量化方案,并通过专家均匀激活校准避免了量化失衡。量化后的模型在性能几乎无损的前提下,推理成本下降了30%。

鞠强表示,在具备顶尖专业度的同时,M3 Plus的每Token调用成本甚至低于通用的DeepSeek、通义千问等模型。

医疗健康:2025年AI落地的核心战场

“今年是AI深入医疗领域的关键一年。”王小川判断道。这一趋势已在全球范围内显现:2025年1月,OpenAI推出ChatGPT Health,Anthropic发布Claude for Healthcare;在国内,蚂蚁集团的AI健康应用“阿福”已拥有3000万月活用户。这一切都表明,医疗健康正成为AI技术落地的主战场。

然而,百川选择了一条与众不同的路径。当许多AI应用致力于成为连接个人设备的“健康管家”时,百川则选择了更艰难、更垂直的赛道:直面严肃医疗场景,深入医院核心科室,旨在成为医生的“第二大脑”。M3 Plus的发布,标志着中国AI企业通过极致的场景深耕与工程化能力,正在特定垂直领域构建起深厚的竞争壁垒。

王小川预测,在未来三年内,AI辅助的医疗问诊等应用将在全球范围内实现大规模落地。而Baichuan-M3 Plus,正以其前所未有的准确性、可追溯性及可及性,为这一未来铺平道路。

立即申请,加入「海纳百川」计划


想获取更多AI最新资讯智能工具推荐, 欢迎访问 👉 AI Tools Nav ——优质的 AI导航平台AI学习社区


本文来源:机器之心

原文链接:https://www.jiqizhixin.com/articles/1a55ceab-4865-44ae-b77b-42880748117b

本站部分内容来源于网络,均已注明来源和出处(如有遗漏非主观故意)。本站尊重原创版权,转载内容版权归原作者所有,仅用于信息整理与交流。如原作者不同意转载,请联系我们进行删除或调整。

相关文章