首页 > AI头条  > 正文

微软推出 MAI-DxO AI 系统,医疗诊断准确率提升四倍

2025-07-01 15:01 · 来源: AIbase基地

微软近日发布了一款全新的 AI 系统 MAI-DxO,旨在显著提升复杂医疗病例的诊断准确性。据悉,该系统的诊断准确率是经验丰富医生的四倍,同时能够将医疗成本降低近70%。这一技术通过一个新的基准测试进行评估,模拟了真实的逐步诊断过程。

image.png

研究团队在其论文《利用语言模型进行顺序诊断》中详细介绍了该系统,认为其在面对挑战性病例时,在准确性和成本效益方面显著优于人类医生。为了提供更真实的测试结果,团队创建了顺序诊断基准(SDBench)。与传统的医学 AI 测试不同,SDBench 并非一次性提供所有信息,而是模拟临床决策的顺序过程。

SDBench 的测试案例来源于《新英格兰医学杂志》的304个复杂病例。测试中,医生或 AI 诊断师首先获得一个简要的病例摘要,然后需主动请求更多信息,通过询问针对性的问题或要求检查来获取详细资料。该系统通过 “门控模型” 控制信息的发布,甚至可以生成某些检测的合成结果,以防止无意间泄露提示信息。

image.png

在测试中,来自美国和英国的21名经验丰富的医生的诊断准确率为19.9%,每个病例的平均费用为2963美元。相比之下,微软的 MAI-DxO 结合 OpenAI 的 o3模型,达到了79.9% 的准确率,且平均成本为2397美元。MAI-DxO 的主要进步在于成本的显著降低。尽管 o3模型在标准模型中达到78.6% 的最高准确率,但其平均费用高达7850美元。而通过 MAI-DxO 进行的诊断,准确率略有提升,成本却几乎降低了70%。

MAI-DxO 通过模拟一个虚拟的医生团队来提升性能。团队内部分别由 “假设医生”、“测试选择医生”、“质疑医生”、“成本监控医生” 和 “检查清单医生” 组成。这样的结构旨在防止系统过早固定于某一假设。

然而,研究人员也承认了一些限制因素。SDBench 仅基于复杂的教学案例,未能反映日常诊疗中常见病症的分布。成本计算只是粗略估算,未考虑现实世界中的多种因素。此外,参与的医生为全科医生,通常在面对复杂病例时会转介给专家,他们的评估也未利用外部资源。

划重点:

🔍 MAI-DxO 系统的诊断准确率是经验医生的四倍,成本降低近70%。  

💡 SDBench 测试模拟真实的逐步诊断过程,通过动态请求信息提升准确性。  

🩺 研究指出系统性能优越,但存在针对复杂病例的限制与挑战。

  • 相关推荐
  • 国内领先!移动云大云天元操作系统通过安全操作系统四级认证

    移动云自主研发的大云天元操作系统近日通过公安部网络安全专用产品安全检测,获得安全操作系统第四级认证。该系统凭借扎实的产品安全能力和完善的安全管理体系,成为国内首个通过该级别认证的国产操作系统。这一成果体现了其在安全领域的技术积累与行业地位,为保障客户数据安全和业务稳定运行提供可靠支撑,标志着国产操作系统安全能力达到国内领先水平。

  • 百川开源最新医疗大模型,中国力量领跑医疗AI赛道

    专注医疗后,百川智能交出第一份答卷! 8月11日,百川智能发布第二款开源医疗增强推理大模型Baichuan-M2,其以32B的参数量,在OpenAI的Healthbench评测集上,超越其刚刚发布5天的开源模型gpt-oss-120b。

  • 2024年泰国GMV增长四倍 52TOYS泰国七号店盛大开业

    2025年8月1日,52TOYS在泰国曼谷西康广场开设第七家门店,开业当天吸引数百粉丝排队。泰国当红艺人First和Khaotung亲临现场,带来新品NOOK"OOTD"系列和CiCiLu"海洋小信使"系列与粉丝互动。52TOYS自2019年进入泰国市场后发展迅速,2024年GMV同比增长四倍。品牌既有自有IP如NOOK、胖哒幼等,也拥有蜡笔小新等授权IP,深受当地消费者喜爱。新店位于曼谷老牌购物中心,毗邻知名夜市,地理位置优越。CEO陈威表示,泰国充满创造力的市场环境与品牌理念高度契合。未来52TOYS将持续深耕东南亚市场,通过创新产品和多元渠道为全球玩家带来更多有趣体验。

  • “识别准确又安全”的小艺输入法联名热门IP,定制皮肤全新上线!

    小艺输入法获华为高管余承东高度称赞,支持语音、翻译、拍摄、文本等多种输入方式,识别准确安全。与热门IP联名推出多款高颜值皮肤,提升个性化体验。支持25种方言识别和实时翻译功能,方便跨语言沟通。数据安全严格防护,确保用户隐私。输入高效便捷,兼具实用与趣味性。

  • 中大型企业用工新方案:可覆盖核心业务岗位,尘锋AI员工助力工作效率10倍提升!引领企业业务增长新范式!

    文章介绍了尘锋AI员工如何帮助200人以上规模企业解决用工成本高、服务效率低等问题。该AI系统融合DeepSeek、文心一言等大模型能力,结合30+行业经验,可覆盖售前接待、销售报价等核心岗位,实现1个AI员工替代10个人工,提升线索利用率70%、售后人效50%。通过多Agent体系控制模型确保业务准确性,采用大模型+小模型动态选择机制平衡成本与效能。目前已在医疗、教育等行业应用,未来将推动"人+AI"用工模式,赋能企业营销-销售-服务全流程,提升获客效率和服务质量。

  • 2024年提升工作效率的必备AI工具精选清单(附终极挑选攻略)

    在AI工具泛滥的当下,许多人陷入效率困境:安装大量应用却效率不降反升。关键在于选择真正适合的工具,而非数量。好工具需匹配需求、成本预算及易用性。AIbase.cn作为导航平台,通过场景化分类、智能筛选和对比功能,帮助用户高效定制专属工具清单,从“喂鱼”变为“教钓鱼”,提供持续适用的方法论。

  • 常德二院全栈国产化信创打造医疗新质生产力

    常德市第二人民医院于2025年4月30日上线全国首个地方三级医院全栈国产化医疗信创项目,覆盖HIS、EMR等核心系统,实现医疗信息化自主可控。项目显著提升效率,患者候诊时间缩短20%,影像调阅速度大幅提升。通过电科金仓数据库等国产技术支撑,打破对国外技术依赖,形成可复制样板,为医疗行业数字化转型提供经验。

  • 微星宣布推出 GODLIKE十周年纪念版和 X870E MAX 系列主板

    微星将在2025年科隆游戏展期间重点展示全新X870E MAX系列主板,并推出GODLIKE十周年限量版纪念主板,全球仅1000块。新品搭载第三代龙魂动态面板、EZ Link等创新技术,支持PCIe 5.0和M.2全带宽性能。同时推出MPG CORELIQUID P13系列水冷解决方案,配备2.1英寸LCD屏,支持个性化内容展示。此外还展示MEG MAESTRO900机箱、MAG PANO130R PZ机箱及MAG VIEW XPANDER12扩展屏等产品,满足PC爱好者对性能与定制化的需求。

  • 为应对AI能耗问题 微软耗资17亿美元买“粪便”埋地

    近日,科技圈出现了一个非常有意思的事情,微软花了17亿美元去买粪便”。 这不是什么隐晦的比喻,就是字面意义的屎”粪便”,包括人和动物拉的那种 据悉,微软的AI业务,包括Copilot、必应AI搜索和OpenAI的ChatGPT等,能耗巨大。 GPT-4训练一次需消耗五六千万度电,排放1.2万到1.5万吨二氧化碳,相当于3000多辆油车一年的排放量。 2024财年,微软的碳排放比2020年增加了23.4%,

  • ​京东推出“新品孵化三步法”:AI技术升级引爆新品效率 助力转化率更高

    8月4日,京东新品学习中心在北京举行开学典礼,宣布全新上线"京东新品学习中心",同时升级"京东新品运营中心",推出"方法论+实战平台"组合拳赋能商家。京东创新推出"新品孵化三步法",通过标准化路径和持续升级的营销玩法,为商家提供从预热、上线冷启动到加速推爆的全周期解决方案。京东零售平台营销负责人表示,将基于"百千亿"计划强化精准营销能力,通过AI提效和超2亿搜推流量加速新品成长。新品孵化三步法包括:商家预热阶段通过大数据洞察需求;上线冷启动阶段精准破圈验证潜力;加速推爆阶段投入重磅资源实现爆发。京东同步构建了新品学习与运营双平台,形成"学-练-战"一体化赋能闭环,助力商家高效打造爆款新品。

今日大家都在搜的词: