首页 > AI头条  > 正文

百川推出创新医疗大模型 M2Plus,降低医疗幻觉率显著

2025-10-22 16:56 · 来源: AIbase基地

近日,百川大模型正式发布了其最新的医疗大模型 ——Baichuan-M2Plus,并同步升级了配套应用百小应,开放了 API 接口。这一发布标志着百川在推出开源模型 Baichuan-M2后的又一重要进展。

通过一系列评测,M2Plus 在医疗幻觉率方面表现优异,较通用大模型显著降低,尤其在与现有医疗产品 DeepSeek 的比较中,幻觉率降低了约3倍,甚至超过了美国流行的医疗应用 OpenEvidence。

核磁共振 医疗 (1)

图源备注:图片由AI生成,图片授权服务商Midjourney

M2Plus 采用了六源循证推理(EAR)范式,成为被誉为 “医生版 ChatGPT” 的智能助手。该模型针对严肃医疗场景中的应用难题,整合了原始研究、证据综述、指南规范、实践知识、公共健康教育以及监管的真实世界信息,构建了完整的医学知识体系,确保医疗决策的可信性和科学性。

在循证检索方面,M2Plus 利用 PICO 框架,将医疗查询转化为结构化问题,确保检索到的信息既精准又可靠。该模型的设计使得医生在面对复杂的医疗问题时,能够获得高等级、可信的医学证据,大幅提升医疗信息的使用效率。

更值得关注的是,M2Plus 在回答医疗问题时采用了 “循证增强训练” 机制,确保模型的回答不仅基于检索到的证据,还能有效避免随意生成信息的情况。通过强化引用权威资料并评估证据质量,M2Plus 展现出与资深临床专家相当的可信度。

在多次医疗场景的测试中,M2Plus 获得了临床医生的高度评价,尤其在分析病史、诊断思路和治疗方案时,其回答的准确性和专业性得到了广泛认可。此外,在美国执业医师资格考试(USMLE)中,M2Plus 取得了惊人的97分的佳绩,进一步证明了其在医疗领域的应用潜力。

划重点:

🌟 M2Plus 模型发布,显著降低医疗幻觉率,超越多款现有医疗产品。

🔍 采用六源循证推理(EAR)范式,确保医疗决策的科学性和可信性。

🏆 在 USMLE 考试中取得97分,显示出卓越的医疗专业能力。

  • 相关推荐
  • AI日报:OpenAI发布浏览器Atlas;通义Qwen3-VL新增2B、32B两个模型尺寸;百川发布循环证据增强大模型

    本文汇总AI领域最新动态:OpenAI推出集成ChatGPT的Atlas浏览器,实现多任务自主处理;阿里通义千问新增2B/32B视觉语言模型,手机可流畅运行;谷歌AI Studio升级Vibe Coding功能,简化应用开发流程;百川发布医疗大模型M2Plus,通过循证推理降低误诊率;奇瑞墨甲机器人实现L3级技术突破,计划多行业应用;YouTube推出AI肖像识别工具,打击虚假内容;三星宣布2026年推出AI眼镜,融合AR与语音助手;Claude客户端更新,支持截图分析和语音交互功能。

  • 医疗、康复与养老的界限正在消融,康复医疗中心正是长者需要的“家外之家”

    清晨六点半,南京玄武营苑社区广场已开始忙碌。医护人员为居民提供血压血糖检测及健康指导,现场氛围亲切如老友重逢。这场义诊是幸福颐养集团"医养结合进社区"项目的缩影,十年来已服务全国数百社区。通过建立健康档案实现长期跟踪,从治病到守护,从陌生到信任。未来计划将服务延伸至更多老旧社区,聚焦失能、术后康复长者需求,编织更密实的健康守护网。十年再出发,步履未停。

  • 京东11.11发放2351元现货惊喜补贴:PLUS会员可领至高1111元超级补贴

    京东11.11于10月20日晚8点启动“超级补贴日”,推出2351元现金补贴,覆盖家电、美妆、手机等多品类。消费者在APP搜索“京东双11”即可一键解锁大额券,购买iPhone 17 Pro系列可叠加优惠达800元起。活动还结合“国家补贴×百亿补贴”实现双补加码,部分商品折扣低至212.5元。现货开卖、价保服务保障权益,助力品质消费体验升级。

  • 来教装展,看全栈自主可控国产教育大模型何以赋能教学?

    10月24-26日,第86届中国教育装备展在青岛举行。科大讯飞以“全栈自主可控国产教育大模型”为核心,展示五大智慧教育场景:智慧教学通过AI黑板实现师生协同,提升效率;科学教育推出AI虚拟科学家互动平台,激发探索精神;身心健康方案构建体育健康闭环与心理服务体系;教育治理推出数据驱动决策平台;学前教育引入游戏化学习产品。目前方案已覆盖全国5万余所学校,服务超1.3亿师生,展现AI从工具升级为“教育伴侣”的价值。

  • 创新驱动 芯耀未来——CPCA Show Plus 2025助力产业共享AI时代发展机遇

    2025年电子半导体产业创新发展大会暨国际电子电路(大湾区)展览会(CPCA Show Plus)将于10月28-30日在深圳举办。展会以“创新驱动,芯耀未来”为主题,汇聚超300家展商,覆盖PCB制造全产业链,聚焦AI时代产业升级。活动将展示智能制造、绿色环保方案,举办多场技术论坛,推动产业链高效对接与协同发展,助力行业把握智能化、低碳化新机遇。

  • 升级版“蓝心小V”亮相,豆包大模型助力vivo打造AI原生体验

    vivo发布全新OriginOS 6系统,升级私人助手“蓝心小V”。该系统依托蓝心大模型与豆包大模型协同,实现精准意图识别与多模态交互,支持新闻、教育、天气等场景的智能问答。通过火山引擎联网搜索及内容整合,提供低延迟、高情感语音响应。同时拓展无障碍服务,为视障用户提供实时视觉辅助。未来将持续深化AI生态建设,打造更智能便捷的原生体验。

  • 百度百科词条总量突破3000万,联合《大学科普》等多机构推出科普专刊

    10月24日,百度百科联合《大学科普》推出“繁星计划”主题专刊,作为该刊2025年第3期面向全国高校发行,助力权威科普传播。同日,繁星计划新增北京林业大学林学院等5家合作机构,扩大行业影响力。该计划自2024年12月启动,已联合10万专家、500家机构共建超100万专业词条,百度百科词条总量突破3000万。通过与权威期刊合作,百度百科旨在为高校学子搭建连接前沿科学与知识普及的桥梁,践行“让知识轻松可及”的使命。

  • AI日报:视觉中国与多家大模型公司达成合作;OpenAI紧急暂停Sora生成已故名人;谷歌推出Gemini地图数据集成工具

    视觉中国与多家AI公司合作开发可商用视觉大模型,已获阿里、微软等订单。OpenAI因不当内容暂停Sora生成马丁·路德·金形象视频,引发AI伦理讨论。DeepSeek在加密货币交易实验中表现领先。WhatsApp将禁止第三方通用AI聊天机器人,仅保留Meta AI。宇树科技推出仿人机器人Unitree H2,具备拟人化设计。谷歌为Gemini集成地图数据工具,可访问25亿地点实时信息。Opera推出集成三款AI助手的Neon浏览器,但用户体验存在困惑。Facebook在美加推出AI照片编辑建议功能,可分析手机未分享照片。

  • 金蝶征信“金融风控大模型” 摘得AFAC2025大奖

    一家社区水果店凭借收款码的36个月交易记录,将银行贷款额度从7万元提升至10万元。这揭示了中国超3亿商户正通过二维码流水数据构建数字信用体系:使用收款码满六个月的商户获贷可能性超60%,三年后跃升至90%。此类高频实时数据正重塑风控逻辑——不看抵押、不看报表,只忠实记录每笔交易背后的经营事实。金蝶征信凭借AI与知识图谱技术,穿透至6层交易链条,构建包含4.45亿交易关系的产业互联网图谱,助力金融机构实现精准信贷匹配。其智能风控系统已推动合作机构放贷额度提升50%,标志着风控模式从“经验驱动”向“数据智能驱动”的转型。

  • 金融行业用好大模型,只有“垂直”一个解

    文章探讨大模型在金融等复杂业务场景的落地挑战,指出通用模型难以满足行业对准确性、可解释性及合规性的高要求。垂直模型通过内化行业核心知识与能力,成为解决复杂业务问题的关键路径。实践显示,金融垂直模型已在营销、客服、风控等场景实现显著成效,如提升效率80%、降低风险。未来需通过数据飞轮、深度适配等技术实现模型持续迭代,构建一站式金融垂直模型生产工场。

今日大家都在搜的词: