首页 > 业界 > 关键词  > MedChatZH最新资讯  > 正文

MedChatZH:一款专为传统中医会诊设计的调校LLM模型

2024-03-19 14:30 · 稿源:站长之家

划重点:

⭐️ MedChatZH 是一个专门针对传统中医对话优化的 AI 系统,在中医会诊中表现出色。

⭐️ 通过收集大量中医文献构建了一个预训练语料库,并创建了一个结合一般对话和医学对话的高质量数据集。

⭐️ MedChatZH 在真实世界的中医问答基准数据集上表现优越,超越了其他基线模型。

站长之家(ChinaZ.com)3月19日 消息:Generative Large Language Models (LLMs) 在各种自然语言处理任务中取得了显著成功,包括问答和对话系统。然而,大多数模型是在英文数据上训练的,缺乏在提供中文答案方面的强大泛化能力。

image.png

为了解决这一问题,研究团队推出MedChatZH,这是一个专为中医问答优化的对话模型,基于 LLaMA 架构的 transformer 解码器。通过在精心筛选的医学指导数据集上进行微调,MedChatZH 在真实世界的医学对话数据集上显著优于几个中文对话基线模型。我们的模型、代码和数据集都在 GitHub 上公开可用,以鼓励进一步在传统中医和 LLMs 领域的研究和发展。

目前,大型语言模型在各种下游自然语言处理任务中表现出色,其中包括机器翻译和实体识别。在2023年,OpenAI 推出了 ChatGPT 系列生成式对话模型,在学术和工业领域引起了重大反响,显著推动了自然语言技术领域的发展。然而,大多数语言模型,包括 ChatGPT,主要是在英文数据集上训练和微调的。当应用于其他语言(如中文)时,由于词汇不匹配、语料上下文和回答习惯的差异,它们往往遇到限制,导致响应质量和泛化能力下降。此外,在通用语言模型中缺乏特定领域理解的问题在专业领域中尤为突出,如传统中医会诊。即使是像 ChatGPT 这样的模型在这一任务中也会遇到困难,原因有:医学领域中严格的道德和审查约束,导致拒绝提供医疗建议;中医训练数据的缺乏,导致对中医相关查询的理解不足。

为了解决 LLMs 在中文应用场景中的领域适应挑战,研究人员提出了一组新的基础模型,包括 Chinese-LLaMA 和 BLOOM,这些模型扩展并在中文词汇上进行训练,以及 GLM 等双语模型。然而,将通用语言模型直接应用于专业领域仍未达到期望的性能水平。与丰富多样的英文语料相比,中文语料往往被隔离在各种商业软件中,不易公开获取,或者在互联网上受到质量不佳和缺乏同行审查的困扰。这导致中文预训练语料和下游任务数据的稀缺,是训练通用中文 LLMs 的主要障碍。将通用语言模型应用于中文特定垂直领域的挑战更为突出,如中医会诊对话。即使是 ChatGPT 等模型在这一任务中也面临困难,原因有:医学领域中严格的道德和审查约束,通常导致拒绝提供医疗建议;中医训练数据的缺乏,导致对中医相关查询的理解不足。

为了解决中医 QA 领域的研究空白,增强对话能力,本文介绍了一个专门为中医患者对话优化的生成式 LLM,MedChatZH。首先在大量的中医文献上进行训练,使其获得了传统中医知识的全面可靠基础。然后在一个高质量的数据集上进行微调,该数据集结合了医学和一般对话,经过启发式和基于模型的过滤等复杂数据处理步骤,以去除不相关或敏感内容,例如个人信息和口语回复。MedChatZH 的表现在真实世界的中医问答基准数据集上得到了测试,评估指标涵盖了传统和基于奖励的模型评分。结果表明,MedChatZH 在中医对话 LLMs(如 BenTsao(原名:HuaTuo)和 HuatuoGPT)上表现优异。

论文的主要贡献如下:

1. 提出了 MedChatZH,一个专门针对传统中医会诊对话设计的生成式 AI 系统,表现良好。

2. 收集和整理了大量中医文献,构建了一个预训练语料库,并构建了一个结合一般对话和医学对话的高质量数据集。通过启发式和奖励评估,过滤掉敏感信息和质量低下的口语回复。

3. 在真实世界的中医问答基准数据集上评估了 MedChatZH 的性能,展示了其在多个评估指标上优于其他基线模型。

MedChatZH 在管理传统中医对话的独特复杂性方面表现出色,这可以归因于它在大量中医文献上的广泛预训练,以及在结合医学和一般对话的数据集上进行微调。MedChatZH 的有效性有望为特定于不同语言和文化背景的 LLMs 开辟新途径。

论文地址:https://www.sciencedirect.com/science/article/abs/pii/S0010482524003743?dgcid=rss_sd_all

举报

  • 相关推荐
  • 谁能成为中国的ChatGPT?夸克抢先交卷

    在OpenAI上线自己家AI浏览器ChatGPT Atlas的同一周,微软在海外发布了新的AI助手Mico和更AI化的Edge浏览器,夸克则在国内推出了新的「对话助手」功能。 这一系列消息背后,新旧巨头、两个市场产生了两个确定的共识:一个是AI助理与AI浏览器的融合会进一步深化,入口之争就是系统之争;另一个是对话会成为人与AI交互的主要方式,自然语言就是未来的编程语言。 在海外市场,OpenA

  • 如何让你的内容被 ChatGPT 优先引用?——GEO 优化实战指南

    传统SEO追求"谷歌首页排名",生成式AI时代则需追求"被AI引用"。AI模型不提供明确排名算法,更像黑箱,使内容创作者困惑。GEO优化的核心是让内容具备"可引用性":权威清晰、结构化信息、语义覆盖多维度、模型检索映射。需通过AIBase等GEO排名查询工具验证"AI曝光率",分析引用语境、竞争差距,调整内容结构以提升AI引用倾向。SEO优化机器如何找到你,GEO则优化AI如何引用你。

  • 如何提升品牌在AI回答中的提及率?GEO优化3招,让ChatGPT主动提及你的品牌

    本文探讨AI搜索时代品牌面临的"隐身危机",指出AI搜索用户年增538.7%,但品牌在AI回答中提及率不足20%。提出三大核心策略:1)构建权威背书矩阵,通过知乎等高权重平台获取自然提及;2)优化AI友好内容,采用对话式标题和结构化数据;3)建立数据监测闭环,通过A/B测试持续迭代。强调需善用监测工具实时追踪品牌在豆包、文心一言等AI模型的曝光表现,避免内容"注水"。最终实现从"被动等待"到主动抢占AI"第一屏"的转变。

  • 华为WATCH Ultimate 2非凡探索版明日开启预售

    华为正式宣布旗舰智能手表WATCH Ultimate 2非凡探索将于11月7日开启预售。这款“全能表王”支持150米潜水与音频功能,具备海豚声呐通信技术,可在水下30米实现手表间信息传输,60米内一键SOS求救。同时搭载北斗卫星语音消息功能,无网络环境下可通过卫星发送语音信息。硬件上配备1.5英寸OLED屏幕,峰值亮度达3500nit,支持20ATM防水与IP68/9防尘。省电模式下续航达11天,常规使用达4.5天。该手表海外售价799英镑(约7443元人民币),国内价格尚未公布。

  • AI日报:可复刻音色的MiniMax Speech 2.6发布;TikTok推AI剪辑新工具“Smart Split”;Cursor 2.0发布

    本期AI日报聚焦多项技术突破:MiniMax发布低延迟语音合成系统Speech 2.6,实现实时交互;蚂蚁数科与宁波银行打造的金融AI方案入选国际标准;智源推出具身操作能力的Emu3.5多模态模型;Cursor 2.0通过自研模型实现多智能体协同编程;xAI升级Grok新增视频生成功能;OpenAI推出可定制安全模型;TikTok推出AI剪辑工具Smart Split;微软发布强化学习框架Agent Lightning提升大模型训练效率。

  • GEO如何改变ChatGPT搜索和Perplexity的游戏规则

    本文对比ChatGPT与Perplexity两大AI搜索平台:ChatGPT作为全能型助手,整合搜索与多任务处理,但存在信息时效性不足;Perplexity专注垂直搜索,强调引用透明与权威来源。针对AI搜索优化(GEO),提出差异化策略:面向ChatGPT需构建结构化知识库、强化品牌实体识别;面向Perplexity需注重权威数据引用和元数据优化。文章还介绍了AIBase的GEO监测工具,通过曝光率等指标量化内容在AI生态中的可见度,并给出可落地的优化行动方案。

  • vivo WATCH GT 2已支持开通移动/联通eSIM服务

    vivo WATCH GT2智能手表正式支持中国移动与联通的eSIM服务,提供一号双终端和独立终端两种模式,售价699元。配备2.07英寸大屏、2400nits峰值亮度,续航达33天。支持全天心率、血氧、睡眠监测及多种运动模式,搭载自研蓝河操作系统3.0与智能助手,可跨设备连接vivo和iPhone,实现双机通知同步。

  • OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

    OpenAI于10月22日推出首款AI驱动浏览器ChatGPT Atlas,以个性化上网体验为核心。用户点击“Ask ChatGPT”即可在侧边栏实时互动,实现网页摘要生成、航班预订、文档编辑等多样化任务。目前仅支持macOS,未来将扩展至Windows和移动端。高级代理功能暂限付费用户使用,其特色包括自动捕捉页面上下文、分屏浏览及记忆用户操作历史,旨在通过自然对话提升网络使用效率。

  • 进博会“全勤生”三星的AI全景图:AI Home中国首秀

    三星在进博会上首次展出AI+Home智能家庭解决方案,通过Bespoke AI、Vision AI和Galaxy AI三大模块,实现全场景智慧生活。AI正从"会语言"向"会行动"演进,软硬件协同成为核心竞争力。三星凭借从芯片到终端的全产业链优势,打破端侧AI的性能、算力与存储"不可能三角",构建起覆盖手机、电视、家电的生态闭环。未来,AI将全面接管生活,让科技真正服务于人。

  • OpenAI 推出浏览器:“让位吧,Chrome”

    ​北京时间10月22日凌晨,没等来传闻中的Gemini3,等来了OpenAI正式发布首款AI浏览器ChatGPT Atlas。 简单来说,这是一个把ChatGPT"塞进"浏览器的产品,你在任何网页上都能随时唤出ChatGPT侧边栏,让AI帮你总结内容、编辑文字、甚至代替你完成购物和预订任务。 听起来有点像Chrome装了个ChatGPT插件?确实如此,但OpenAI的野心远不止于此。

今日大家都在搜的词: