MedChatZH:一款专为传统中医会诊设计的调校LLM模型

2024-03-19 14:30 · 稿源：站长之家

划重点:
⭐️ MedChatZH 是一个专门针对传统中医对话优化的 AI 系统，在中医会诊中表现出色。
⭐️ 通过收集大量中医文献构建了一个预训练语料库，并创建了一个结合一般对话和医学对话的高质量数据集。
⭐️ MedChatZH 在真实世界的中医问答基准数据集上表现优越，超越了其他基线模型。

站长之家（ChinaZ.com）3月19日消息:Generative Large Language Models （LLMs）在各种自然语言处理任务中取得了显著成功，包括问答和对话系统。然而，大多数模型是在英文数据上训练的，缺乏在提供中文答案方面的强大泛化能力。

为了解决这一问题，研究团队推出MedChatZH，这是一个专为中医问答优化的对话模型，基于 LLaMA 架构的 transformer 解码器。通过在精心筛选的医学指导数据集上进行微调，MedChatZH 在真实世界的医学对话数据集上显著优于几个中文对话基线模型。我们的模型、代码和数据集都在 GitHub 上公开可用，以鼓励进一步在传统中医和 LLMs 领域的研究和发展。

目前，大型语言模型在各种下游自然语言处理任务中表现出色，其中包括机器翻译和实体识别。在2023年，OpenAI 推出了 ChatGPT 系列生成式对话模型，在学术和工业领域引起了重大反响，显著推动了自然语言技术领域的发展。然而，大多数语言模型，包括 ChatGPT，主要是在英文数据集上训练和微调的。当应用于其他语言（如中文）时，由于词汇不匹配、语料上下文和回答习惯的差异，它们往往遇到限制，导致响应质量和泛化能力下降。此外，在通用语言模型中缺乏特定领域理解的问题在专业领域中尤为突出，如传统中医会诊。即使是像 ChatGPT 这样的模型在这一任务中也会遇到困难，原因有:医学领域中严格的道德和审查约束，导致拒绝提供医疗建议;中医训练数据的缺乏，导致对中医相关查询的理解不足。

为了解决 LLMs 在中文应用场景中的领域适应挑战，研究人员提出了一组新的基础模型，包括 Chinese-LLaMA 和 BLOOM，这些模型扩展并在中文词汇上进行训练，以及 GLM 等双语模型。然而，将通用语言模型直接应用于专业领域仍未达到期望的性能水平。与丰富多样的英文语料相比，中文语料往往被隔离在各种商业软件中，不易公开获取，或者在互联网上受到质量不佳和缺乏同行审查的困扰。这导致中文预训练语料和下游任务数据的稀缺，是训练通用中文 LLMs 的主要障碍。将通用语言模型应用于中文特定垂直领域的挑战更为突出，如中医会诊对话。即使是 ChatGPT 等模型在这一任务中也面临困难，原因有:医学领域中严格的道德和审查约束，通常导致拒绝提供医疗建议;中医训练数据的缺乏，导致对中医相关查询的理解不足。

为了解决中医 QA 领域的研究空白，增强对话能力，本文介绍了一个专门为中医患者对话优化的生成式 LLM，MedChatZH。首先在大量的中医文献上进行训练，使其获得了传统中医知识的全面可靠基础。然后在一个高质量的数据集上进行微调，该数据集结合了医学和一般对话，经过启发式和基于模型的过滤等复杂数据处理步骤，以去除不相关或敏感内容，例如个人信息和口语回复。MedChatZH 的表现在真实世界的中医问答基准数据集上得到了测试，评估指标涵盖了传统和基于奖励的模型评分。结果表明，MedChatZH 在中医对话 LLMs（如 BenTsao(原名:HuaTuo）和 HuatuoGPT)上表现优异。

论文的主要贡献如下:

1. 提出了 MedChatZH，一个专门针对传统中医会诊对话设计的生成式 AI 系统，表现良好。

2. 收集和整理了大量中医文献，构建了一个预训练语料库，并构建了一个结合一般对话和医学对话的高质量数据集。通过启发式和奖励评估，过滤掉敏感信息和质量低下的口语回复。

3. 在真实世界的中医问答基准数据集上评估了 MedChatZH 的性能，展示了其在多个评估指标上优于其他基线模型。

MedChatZH 在管理传统中医对话的独特复杂性方面表现出色，这可以归因于它在大量中医文献上的广泛预训练，以及在结合医学和一般对话的数据集上进行微调。MedChatZH 的有效性有望为特定于不同语言和文化背景的 LLMs 开辟新途径。

论文地址:https://www.sciencedirect.com/science/article/abs/pii/S0010482524003743?dgcid=rss_sd_all

（举报）

相关推荐

关键词：

荐谁能成为中国的ChatGPT？夸克抢先交卷

在OpenAI上线自己家AI浏览器ChatGPT Atlas的同一周，微软在海外发布了新的AI助手Mico和更AI化的Edge浏览器，夸克则在国内推出了新的「对话助手」功能。这一系列消息背后，新旧巨头、两个市场产生了两个确定的共识:一个是AI助理与AI浏览器的融合会进一步深化，入口之争就是系统之争;另一个是对话会成为人与AI交互的主要方式，自然语言就是未来的编程语言。在海外市场，OpenA

AI浏览器 ChatGPT Atlas
如何让你的内容被 ChatGPT 优先引用？——GEO 优化实战指南

传统SEO追求"谷歌首页排名"，生成式AI时代则需追求"被AI引用"。AI模型不提供明确排名算法，更像黑箱，使内容创作者困惑。GEO优化的核心是让内容具备"可引用性"：权威清晰、结构化信息、语义覆盖多维度、模型检索映射。需通过AIBase等GEO排名查询工具验证"AI曝光率"，分析引用语境、竞争差距，调整内容结构以提升AI引用倾向。SEO优化机器如何找到你，GEO则优化AI如何引用你。

SEO优化 AI引用内容权威性
如何提升品牌在AI回答中的提及率？GEO优化3招，让ChatGPT主动提及你的品牌

本文探讨AI搜索时代品牌面临的"隐身危机"，指出AI搜索用户年增538.7%，但品牌在AI回答中提及率不足20%。提出三大核心策略：1）构建权威背书矩阵，通过知乎等高权重平台获取自然提及；2）优化AI友好内容，采用对话式标题和结构化数据；3）建立数据监测闭环，通过A/B测试持续迭代。强调需善用监测工具实时追踪品牌在豆包、文心一言等AI模型的曝光表现，避免内容"注水"。最终实现从"被动等待"到主动抢占AI"第一屏"的转变。

文章搜索核心标签 SEO优化
华为WATCH Ultimate 2非凡探索版明日开启预售

华为正式宣布旗舰智能手表WATCH Ultimate 2非凡探索将于11月7日开启预售。这款“全能表王”支持150米潜水与音频功能，具备海豚声呐通信技术，可在水下30米实现手表间信息传输，60米内一键SOS求救。同时搭载北斗卫星语音消息功能，无网络环境下可通过卫星发送语音信息。硬件上配备1.5英寸OLED屏幕，峰值亮度达3500nit，支持20ATM防水与IP68/9防尘。省电模式下续航达11天，常规使用达4.5天。该手表海外售价799英镑（约7443元人民币），国内价格尚未公布。

华为WATCH Ultimate2 智能手表
荐AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑新工具“Smart Split”；Cursor 2.0发布

本期AI日报聚焦多项技术突破：MiniMax发布低延迟语音合成系统Speech 2.6，实现实时交互；蚂蚁数科与宁波银行打造的金融AI方案入选国际标准；智源推出具身操作能力的Emu3.5多模态模型；Cursor 2.0通过自研模型实现多智能体协同编程；xAI升级Grok新增视频生成功能；OpenAI推出可定制安全模型；TikTok推出AI剪辑工具Smart Split；微软发布强化学习框架Agent Lightning提升大模型训练效率。

AI日报 MiniMax Speech
GEO如何改变ChatGPT搜索和Perplexity的游戏规则

本文对比ChatGPT与Perplexity两大AI搜索平台：ChatGPT作为全能型助手，整合搜索与多任务处理，但存在信息时效性不足；Perplexity专注垂直搜索，强调引用透明与权威来源。针对AI搜索优化（GEO），提出差异化策略：面向ChatGPT需构建结构化知识库、强化品牌实体识别；面向Perplexity需注重权威数据引用和元数据优化。文章还介绍了AIBase的GEO监测工具，通过曝光率等指标量化内容在AI生态中的可见度，并给出可落地的优化行动方案。
vivo WATCH GT 2已支持开通移动/联通eSIM服务

vivo WATCH GT2智能手表正式支持中国移动与联通的eSIM服务，提供一号双终端和独立终端两种模式，售价699元。配备2.07英寸大屏、2400nits峰值亮度，续航达33天。支持全天心率、血氧、睡眠监测及多种运动模式，搭载自研蓝河操作系统3.0与智能助手，可跨设备连接vivo和iPhone，实现双机通知同步。

vivo WATCH GT2
OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

OpenAI于10月22日推出首款AI驱动浏览器ChatGPT Atlas，以个性化上网体验为核心。用户点击“Ask ChatGPT”即可在侧边栏实时互动，实现网页摘要生成、航班预订、文档编辑等多样化任务。目前仅支持macOS，未来将扩展至Windows和移动端。高级代理功能暂限付费用户使用，其特色包括自动捕捉页面上下文、分屏浏览及记忆用户操作历史，旨在通过自然对话提升网络使用效率。

ChatGPT Atlas 人工智能浏览器
进博会“全勤生”三星的AI全景图：AI Home中国首秀

三星在进博会上首次展出AI+Home智能家庭解决方案，通过Bespoke AI、Vision AI和Galaxy AI三大模块，实现全场景智慧生活。AI正从"会语言"向"会行动"演进，软硬件协同成为核心竞争力。三星凭借从芯片到终端的全产业链优势，打破端侧AI的性能、算力与存储"不可能三角"，构建起覆盖手机、电视、家电的生态闭环。未来，AI将全面接管生活，让科技真正服务于人。

端侧AI AI Home
荐OpenAI 推出浏览器：“让位吧，Chrome”

北京时间10月22日凌晨，没等来传闻中的Gemini3，等来了OpenAI正式发布首款AI浏览器ChatGPT Atlas。简单来说，这是一个把ChatGPT"塞进"浏览器的产品，你在任何网页上都能随时唤出ChatGPT侧边栏，让AI帮你总结内容、编辑文字、甚至代替你完成购物和预订任务。听起来有点像Chrome装了个ChatGPT插件?确实如此，但OpenAI的野心远不止于此。

OpenAI

今日大家都在搜的词：

热文

3 天
7天

MedChatZH:一款专为传统中医会诊设计的调校LLM模型

荐谁能成为中国的ChatGPT？夸克抢先交卷

如何让你的内容被 ChatGPT 优先引用？——GEO 优化实战指南

如何提升品牌在AI回答中的提及率？GEO优化3招，让ChatGPT主动提及你的品牌

华为WATCH Ultimate 2非凡探索版明日开启预售

荐AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑新工具“Smart Split”；Cursor 2.0发布

GEO如何改变ChatGPT搜索和Perplexity的游戏规则

vivo WATCH GT 2已支持开通移动/联通eSIM服务

OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

进博会“全勤生”三星的AI全景图：AI Home中国首秀

荐OpenAI 推出浏览器：“让位吧，Chrome”

今日大家都在搜的词：

热文

特斯拉磁悬浮Cybertruck车模上架中国官网售价999元

华为Mate 70 Air维修备件价格公布：换主板2499元

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

华为Mate70 Air官宣今日开启预售

AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏

OPPO Reno15系列官宣11月10日发布

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

华为路由X3 Pro今日开启预售：售价1299元起

站长商机