复旦大学团队发布中文医疗健康个人助手DISC-MedLLM 单轮问答和多轮对话均表现亮眼

2023-09-01 15:00 · 稿源：站长之家

站长之家（ChinaZ.com）9月1日消息:复旦大学数据智能与社会计算实验室（FudanDISC）发布了中文医疗健康个人助手DISC-MedLLM。该模型在单轮问答和多轮对话的医疗健康咨询评测中表现出色，相比已有医学对话模型具有明显优势。课题组同时公开了包含47万高质量监督微调样本的DISC-Med-SFT数据集，以及模型参数和技术报告。

DISC-MedLLM的三大特点:

1）可靠丰富的专业知识，基于医学知识图谱采样获得;

2）多轮对话的问询能力，基于真实咨询对话重建;

3）对齐人类偏好的回复，通过筛选生成高质量小样本指导模型。DISC-Med-SFT数据集利用通用大模型的语言能力，围绕这三个方面进行针对性强化。

主页地址:https://med.fudan-disc.com

Github 地址:https://github.com/FudanDISC/DISC-MedLLM

技术报告:https://arxiv.org/abs/2308.14346

研究团队采用两阶段训练方法。第一阶段使用MedDialog、cMedQA2等数据集进行监督微调，同时加入通用数据集增强语言表达能力。第二阶段使用行为偏好小样本数据集进行微调，进一步提高模型表现。

在单轮问答评测中，DISC-MedLLM在零样本设置下表现强劲，在小样本设置下仅次于GPT-3.5，优于专业医学问答模型HuatuoGPT。在多轮对话评测中，研究团队采用多种策略构建高质量的DISC-Med-SFT数据集:

1）重构AI医患对话。从MedDialog和cMedQA2中抽取样本，使用GPT-3.5重构对话，调整回复风格使其符合AI助手。

2）知识图谱问答。基于医学知识图谱CMeKG进行三元组采样，生成专业医学问答样本。

3）行为偏好样本。人工筛选MedDialog和cMedQA2中的高质量样本，使用GPT-3.5生成符合人类行为偏好的样本。

4）通用数据。加入通用数据集样本，增强模型基础语言能力。

5）问答样本。使用英文医学问答数据集生成中文医学问答样本。

研究人员计算真实咨询分布，以此指导样本构造，并利用回路和人在回路两种思路生成样本，使数据集质量和多样性显著提高。

DISC-MedLLM弥补了现有模型在医疗知识、对话技能和人类偏好方面的不足，展示了构建高质量领域特定数据集以及数据集驱动方法培训专业对话模型的有效性。

（举报）

相关推荐

关键词：

医疗

荐百川开源最新医疗大模型，中国力量领跑医疗AI赛道

专注医疗后，百川智能交出第一份答卷! 8月11日，百川智能发布第二款开源医疗增强推理大模型Baichuan-M2，其以32B的参数量，在OpenAI的Healthbench评测集上，超越其刚刚发布5天的开源模型gpt-oss-120b。

百川智能医疗大模型开源模型
汪喵灵灵亮相亚宠论坛，AI大模型破解异宠医疗资源困局

2025年亚洲宠物展“亚洲小宠生态论坛”近日举办，汪喵灵灵创始人Luke受邀出席，分享AI宠物医疗大模型如何解决行业资源短缺、推动服务普惠化。该平台覆盖20多种宠物诊疗，通过解析海量文献建立健康档案系统，提供免费问诊与科学养护建议，降低养宠门槛。2024年已通过国家算法备案，成为业内首个合规认证的宠物健康大模型，致力于让每只宠物享有平等医疗关怀。

宠物AI医疗亚洲宠物展览会小宠生态论坛
常德二院全栈国产化信创打造医疗新质生产力

常德市第二人民医院于2025年4月30日上线全国首个地方三级医院全栈国产化医疗信创项目，覆盖HIS、EMR等核心系统，实现医疗信息化自主可控。项目显著提升效率，患者候诊时间缩短20%，影像调阅速度大幅提升。通过电科金仓数据库等国产技术支撑，打破对国外技术依赖，形成可复制样板，为医疗行业数字化转型提供经验。

信创产业医疗信创数字化转型
男子戴尿不湿送外卖赚医疗费：患克罗恩病已花费40多万

近日，一位27岁患克罗恩病的小伙引发社会关注，他一边与病魔顽强抗争，一边靠送外卖赚取医疗费，其坚韧精神令人动容。这位小伙已被克罗恩病折磨了9年之久。由于免疫系统攻击消化系统，他无法正常饮食，日常只能依靠营养液和馒头维持生命。因为经常腹泻，他不得不穿着尿不湿送外卖。谈及收入，小伙无奈表示，受身体状况限制，外卖送得不多，每月收入仅有两三

克罗恩病炎症性肠病慢性消化道疾病
两会热议“互联网+医疗”，移动医疗助力医疗供给侧改革

春节前，一则“东北女孩怒斥北京号贩子”的新闻引发社会关注，“挂号难”击中了几乎每个人的就医痛点。这一话题的热度一直持续到了正在进行的2016年全国两会上，如何破解挂号难、看病贵两大难题，推进医疗供给侧改革，成为代表委员们热议的话题之一。

移动医疗
口碑：“饿了么医美医疗”更名“本地生活医美医疗”

口碑平台发布公告称，将“饿了么医美医疗”更名为“本地生活医美医疗”...今年 2 月，口碑修订了《饿了么医美医疗平台管理规范》，根据饿了么医美医疗平台实际经营情况，修订原市场管理情形及违规情形；取消一般违规行为、严重违规行为的计分及节点扣罚规定，同步新增符合饿了么医美医疗平台经营现状的违规情形及处置措施，处置措施包括但不限于：支付违约金、账期延期、冻结支付账户、限制发布商品、门店清退、店铺清退等...

饿了么口碑医美
巨鼎医疗：技术助力医疗智慧服务健康

合影 12 月 24 日，遂宁市中心医院与阿里健康就共同探索“互联网+智慧医疗”发展新模式，打造智慧医疗服务体系、提升医院管理效能等方面达成共识，并举行签约仪式，正式签署合作协议。巨鼎医疗作为联合重要合作单位应邀出席签约仪式。杨国庆副院长致开场辞并主持签约仪式遂宁市中心医院，一所拥有百年历史的三级甲等综合医院，曾连续六年进入全国地级城市医院 100 强， 2018 年位列全国地级城市医院竞争力第 60 位、四川省域医院?

阿里健康
微信增加医疗健康医疗健康有哪些功能？

4月9日消息，近日微信在其测试的客户端中加入了医疗健康的功能，医疗健康功能有什么功能和作用呢，这里我们来一起看下这个功能的详细介绍。

微信增加医疗健康
发力医疗亚马逊将开发一款医疗记录软件

据《华尔街日报》报道，亚马逊推出了一款可以挖掘医疗记录信息的新软件。据报道，该软件可以扫描患者数字化的病历记录，并提取数据，这是医疗保健专业人士在考虑治疗方案时可以使用的服务，医院也可

医疗亚马逊软件
平安好医生大数据医疗实现医疗AI

我们知道，在大数据时代，行业内谁拥有数据源，谁的数据保有量大，对数据的开发利用水平高，谁就会在行业未来格局中占领致胜高地。平安好医生作为移动医疗第一入口，截至 2017 年 9 月，注册用户达到1. 75 亿，日问诊量超过 45 万，成立三年多以来，积累了天量级的用户交互数据，这些数据成为平安好医生部署未来发展的根基。以数据驱动，平安好医生将在整合优质医疗资源、技术创新等方面大有作为。大众健康档案唤醒国民健康意识

平安好医生大数据

今日大家都在搜的词：

热文

3 天
7天

复旦大学团队发布中文医疗健康个人助手DISC-MedLLM 单轮问答和多轮对话均表现亮眼

荐百川开源最新医疗大模型，中国力量领跑医疗AI赛道

汪喵灵灵亮相亚宠论坛，AI大模型破解异宠医疗资源困局

常德二院全栈国产化信创打造医疗新质生产力

男子戴尿不湿送外卖赚医疗费：患克罗恩病已花费40多万

两会热议“互联网+医疗”，移动医疗助力医疗供给侧改革

口碑：“饿了么医美医疗”更名“本地生活医美医疗”

巨鼎医疗：技术助力医疗智慧服务健康

微信增加医疗健康医疗健康有哪些功能？

发力医疗亚马逊将开发一款医疗记录软件

平安好医生大数据医疗实现医疗AI

今日大家都在搜的词：

热文

华为MatePad Mini官宣9月4日发布

2025民营企业500强揭晓：京东第一

今日七夕节微信 520 元大额红包限时上线

AI日报：字节OmniHuman-1.5发布；PixVerse V5模型上线；腾讯

realme真我15000mAh电池容量手机亮相

华为三折叠屏手机Mate XTs非凡大师上架开启预约

小米澎湃OS 3发布：帧率更稳功耗更低

史上最大Mate！华为智慧屏MateTV将于9月4日发布

小米澎湃OS 3今日发布首批29日启动Beta测试推送

腾讯客服回应微信消息撤回时间：文件3小时消息2分钟

华为MatePad Mini官宣9月4日发布

2025民营企业500强揭晓：京东第一

SpaceX第10次试飞成功马斯克：星舰这次没有空中爆炸

AI日报：钉钉十周年发布8.0版本；微信悄悄上线AI播客；阿里开源

小米澎湃OS3发布会官宣首批Beta版招募机型公布

iPhone17Pro爆料汇总：橙色版本成最大亮点或迎12项升级

今日七夕节微信 520 元大额红包限时上线

20周年版iPhone或成苹果首款曲面机：一体环绕玻璃+曲面机身

AI日报：字节视频模型Waver 1.0发布；百度AI搜索APP“梯子AI”

罗永浩播客节目爆火：24小时播放量超2000万晒成绩单求合作

站长商机