首页 > 业界 > 关键词  > MedChatZH最新资讯  > 正文

MedChatZH:一款专为传统中医会诊设计的调校LLM模型

2024-03-19 14:30 · 稿源:站长之家

划重点:

⭐️ MedChatZH 是一个专门针对传统中医对话优化的 AI 系统,在中医会诊中表现出色。

⭐️ 通过收集大量中医文献构建了一个预训练语料库,并创建了一个结合一般对话和医学对话的高质量数据集。

⭐️ MedChatZH 在真实世界的中医问答基准数据集上表现优越,超越了其他基线模型。

站长之家(ChinaZ.com)3月19日 消息:Generative Large Language Models (LLMs) 在各种自然语言处理任务中取得了显著成功,包括问答和对话系统。然而,大多数模型是在英文数据上训练的,缺乏在提供中文答案方面的强大泛化能力。

image.png

为了解决这一问题,研究团队推出MedChatZH,这是一个专为中医问答优化的对话模型,基于 LLaMA 架构的 transformer 解码器。通过在精心筛选的医学指导数据集上进行微调,MedChatZH 在真实世界的医学对话数据集上显著优于几个中文对话基线模型。我们的模型、代码和数据集都在 GitHub 上公开可用,以鼓励进一步在传统中医和 LLMs 领域的研究和发展。

目前,大型语言模型在各种下游自然语言处理任务中表现出色,其中包括机器翻译和实体识别。在2023年,OpenAI 推出了 ChatGPT 系列生成式对话模型,在学术和工业领域引起了重大反响,显著推动了自然语言技术领域的发展。然而,大多数语言模型,包括 ChatGPT,主要是在英文数据集上训练和微调的。当应用于其他语言(如中文)时,由于词汇不匹配、语料上下文和回答习惯的差异,它们往往遇到限制,导致响应质量和泛化能力下降。此外,在通用语言模型中缺乏特定领域理解的问题在专业领域中尤为突出,如传统中医会诊。即使是像 ChatGPT 这样的模型在这一任务中也会遇到困难,原因有:医学领域中严格的道德和审查约束,导致拒绝提供医疗建议;中医训练数据的缺乏,导致对中医相关查询的理解不足。

为了解决 LLMs 在中文应用场景中的领域适应挑战,研究人员提出了一组新的基础模型,包括 Chinese-LLaMA 和 BLOOM,这些模型扩展并在中文词汇上进行训练,以及 GLM 等双语模型。然而,将通用语言模型直接应用于专业领域仍未达到期望的性能水平。与丰富多样的英文语料相比,中文语料往往被隔离在各种商业软件中,不易公开获取,或者在互联网上受到质量不佳和缺乏同行审查的困扰。这导致中文预训练语料和下游任务数据的稀缺,是训练通用中文 LLMs 的主要障碍。将通用语言模型应用于中文特定垂直领域的挑战更为突出,如中医会诊对话。即使是 ChatGPT 等模型在这一任务中也面临困难,原因有:医学领域中严格的道德和审查约束,通常导致拒绝提供医疗建议;中医训练数据的缺乏,导致对中医相关查询的理解不足。

为了解决中医 QA 领域的研究空白,增强对话能力,本文介绍了一个专门为中医患者对话优化的生成式 LLM,MedChatZH。首先在大量的中医文献上进行训练,使其获得了传统中医知识的全面可靠基础。然后在一个高质量的数据集上进行微调,该数据集结合了医学和一般对话,经过启发式和基于模型的过滤等复杂数据处理步骤,以去除不相关或敏感内容,例如个人信息和口语回复。MedChatZH 的表现在真实世界的中医问答基准数据集上得到了测试,评估指标涵盖了传统和基于奖励的模型评分。结果表明,MedChatZH 在中医对话 LLMs(如 BenTsao(原名:HuaTuo)和 HuatuoGPT)上表现优异。

论文的主要贡献如下:

1. 提出了 MedChatZH,一个专门针对传统中医会诊对话设计的生成式 AI 系统,表现良好。

2. 收集和整理了大量中医文献,构建了一个预训练语料库,并构建了一个结合一般对话和医学对话的高质量数据集。通过启发式和奖励评估,过滤掉敏感信息和质量低下的口语回复。

3. 在真实世界的中医问答基准数据集上评估了 MedChatZH 的性能,展示了其在多个评估指标上优于其他基线模型。

MedChatZH 在管理传统中医对话的独特复杂性方面表现出色,这可以归因于它在大量中医文献上的广泛预训练,以及在结合医学和一般对话的数据集上进行微调。MedChatZH 的有效性有望为特定于不同语言和文化背景的 LLMs 开辟新途径。

论文地址:https://www.sciencedirect.com/science/article/abs/pii/S0010482524003743?dgcid=rss_sd_all

举报

  • 相关推荐
  • AI日报:苹果明年推出SiriAI搜索;OpenAI放开ChatGPT Projects功能;Kimi K2-0905 上线 Discord

    本文汇总了AI领域最新动态:苹果与谷歌合作,计划在Siri中引入Gemini AI技术;OpenAI向免费用户开放Projects功能,提升任务管理效率;谷歌推出免费Gemini CLI工具,集成GitHub提升开发效率;OpenAI估值飙升至5000亿美元,二级股票售出103亿美元;苹果自研AI搜索引擎“世界知识问答”计划2026年上线;月之暗面发布Kimi K2-0905模型,提升编程与创意写作能力;Raycast推出Cursor Agent插件优化代码编辑;谷歌发布nano banana官方Prompt模板,助力创意设计。

  • 永恒之声,现代演绎 Technics 推出全新直驱式唱盘机SL40C/40CBT

    Technics推出全新SL-40C/40CBT直驱唱盘系统,融合高端机械技术与现代设计。该产品延续品牌经典特性,如无芯直驱电机和高精度S形铝合金唱臂,同时升级外观与易用性。配备预装唱头、内置唱头放大器,支持蓝牙连接(仅40CBT型号),提供三种现代配色。旨在满足HiFi用户和现代家庭音频爱好者的需求,兼顾音质与便捷体验。

  • 淘宝直播请call赵露思

    今年的暑假大戏,赵露思直播告一段落。 截至目前,距离她上次公开直播已经过去了十余天,她的社交动态也基本停留在这一刻暂未更新。就在8月19日直播中,赵露思首次表态,表示“现在很愿意做网红”,这一宣言并非偶然,就在前一天,她注销了拥有3119万粉丝的微博账号,彻底切断传统明星的流量锚点。

  • 当黑胶豆染上午夜蓝:Technics 60周年的深邃献礼,四色如律至臻原音

    2025年9月,Technics推出旗舰无线蓝牙耳机EAH-AZ100新配色“午夜蓝”,可选颜色增至四种。该耳机凭借卓越音质、智能操控和舒适佩戴体验广受赞誉,采用磁流体驱动单元提供高保真音效,集成自适应降噪和AI语音聚焦功能,支持杜比全景声和360度空间音频。具备多设备连接、Qi无线充电和超长续航28小时,兼容最新蓝牙LE音频标准。

  • 华人风投登上《时代》VC榜单:Foothill入选全美顶尖VC,前沿科技投资力量凸显

    Statista与《时代》杂志联合发布“美国顶尖350家风投机构”榜单,从全美逾万家机构中筛选出前3.5%,涵盖募资能力、投资管理能力、基金回报等关键指标。榜单呈现A16z、Greylock等老牌基金,同时凸显Foothill Ventures等新兴力量,反映美国风投格局日益多元化,包括移民、女性及学者创业等新趋势。

  • 哪里找最新AI工具官网?如何快速对比ChatGPT替代品?AI工具导航指南 - AIbase

    文章探讨了在AI工具爆炸式增长的时代,用户面临的信息过载和筛选困难问题。主要内容包括:1)AI领域迭代速度远超传统软件,个人追踪信息效率低下且容易错过关键更新;2)AIbase.cn平台致力于解决这一问题,通过聚合主流AI工具、严格审核信息来源、持续更新行业动态;3)平台提供多维对比功能,结构化呈现工具参数,帮助用户快速定位适合需求的解决方案;4)建议用户定期浏览平台资讯栏目,善用搜索筛选功能,通过对比视图做出明智选择。核心价值在于降低信息筛选成本,让用户更高效地获取有价值的AI工具和前沿资讯。

  • ChatGPT语音模式增添新功能:可调语速 支持0.5到2.0倍速

    OpenAI为其ChatGPT网页应用的语音模式推出新功能,加入语音速度”调节与自定义指令前缀”,同时配合此前升级的模型选择器,进一步提升用户体验。 新增的语音速度”选项让用户可通过滑块自由调整ChatGPT的语速,范围从0.5倍速到2.0倍速,不过该功能目前仍处于隐藏状态,尚未正式开放。 自定义指令前缀”功能则允许语音模式记住用户的特定要求,避免重复输入。系统明确�

  • 三星Galaxy Watch8系列:帮你解锁不一样的新学期

    新学期开始,假期放松感逐渐褪去。文章强调开学不仅是课程更新,更是生活方式的调整。通过三星Galaxy Watch8系列智能手表,可科学管理作息、饮食和情绪,帮助养成良好习惯,以充沛精力迎接学业挑战。该手表提供睡眠监测、压力趋势分析等功能,助你实现自我提升,成为更好的自己。

  • 苹果首款折叠iPhone细节曝光:支持eSIM、Touch ID回归

    日前,知名科技记者马克古尔曼(Mark Gurman)曝光苹果首款折叠iPhone更多细节。 古尔曼透露,苹果折叠iPhone将配备四颗镜头,分别是外屏前摄、内屏前摄,以及两颗后摄。 另外,新款iPad Air、iPad mini和入门级iPad机型均配备了Touch ID电源键,这一功能可能会延续到折叠iPhone上,而非目前iPhone所使用的面部识别(Face ID)技术。

  • 从瑞幸×浪浪山到喜茶×Chiikawa,萌系联名如何破圈?

    最近,社交平台再次被一波萌系联名刷屏了。 瑞幸推出的《浪浪山小妖怪》主题杯迅速成为职场人士新宠,杯身上“诸邪退散”的字样精准击中打工人的共鸣点;喜茶与Chiikawa的联名产品首日发售,全国多家门店排起长龙,粉丝们纷纷在社交平台晒出集齐全套周边的照片…… 这些现象不禁让人好奇,为什么萌系联名总能一次次引爆市场?本期跟随「克劳锐」的视角一起看看吧~

今日大家都在搜的词: