首页 > 热点 > 关键词  > 正文

中科大联合封神榜团队发布中文医疗领域大模型ChiMed-GPT

2023-11-20 16:27 · 稿源:站长之家

站长之家(ChinaZ.com)11月20日 消息:中科大和 IDEA 研究院封神榜团队合作开发了一款名为 ChiMed-GPT 的中文医疗领域大语言模型(LLM)。该模型基于封神榜团队的 Ziya2-13B 模型构建,拥有130亿个参数,并通过全方位的预训练、监督微调和人类反馈强化学习来满足医疗文本处理的需求。

微信截图_20231120162841.png

ChiMed-GPT 的训练过程包括三个阶段:预训练、监督式微调和人类反馈强化学习。在预训练阶段,模型使用了2.14亿字的医学百科文档和教科书文章进行继续训练,以扩展医疗领域的知识。在监督式微调阶段,模型利用问答和医患对话数据来提升在真实医疗环境中理解人类指令的能力。在人类反馈强化学习阶段,模型使用拒绝采样技术进行训练,通过奖励模型训练和拒绝采样微调来进一步提高模型性能。

在医疗信息抽取、问答和对话生成等任务上,ChiMed-GPT 的性能优于其他同规模的开源模型,并且在多个指标上超越了 GPT-3.5。在医疗信息抽取任务中,ChiMed-GPT 的性能优于通用和医学领域的开源模型。在问答任务和对话生成任务中,ChiMed-GPT 在多个评估指标上表现出色,展示了其在实际应用中的广泛适用性。

据悉,ChiMed-GPT 的研发对于提升医疗智能的重要性具有重要意义。该模型不仅能够有效处理医疗文本数据,还能生成适合回答患者咨询的内容。

Github:

https://github.com/synlp/ChiMed-GPT

HuggingFace:

https://huggingface.co/SYNLP/ChiMed-GPT-1.0

举报

  • 相关推荐
  • 昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

    中国科学技术大学张燕咏团队在昇腾算力支持下,成功研发出基于专家选择分布预测的专家负载均衡和all2all通信均衡框架。该框架通过“三步走”策略,有效解决了MoE稀疏大模型推理中的专家负载不均和通信开销大两大难题,显著提升推理性能。实验显示,该方案在多项指标上较主流方案提升超30%,为昇腾技术优化MoE模型推理提供了宝贵借鉴,将加速其在各领域的落地应用。

  • AI日报:AI内容新规正式生效;美团推出开源大模型LongCat;阶跃发布语音大模型Step-Audio 2 mini

    AI日报栏目每日更新AI领域热点内容,聚焦开发者需求。本期重点包括:阶跃星辰发布端到端语音大模型Step-Audio2 mini,在多项基准测试中表现优异;9月1日起AI生成内容需强制标识;美团推出开源大模型LongCat;上海AI实验室发布多模态大模型InternVL3.5;腾讯ARC团队推出音频生成模型AudioStory;OpenAI发布实时语音模型GPT-realtime;Meta与UCSD合作推出DeepConf技术;xAI代码库遭窃事件;阿里巴巴Qwen团队发布GUI自动化框架;微软推出Copilot Labs实验中心;小红书自动化工具xiaohongshu-mcp上线。

  • 布局口服抗衰,莱特维健联合中科院成立前沿营养与抗衰老研究中心

    随着社会老龄化加剧及健康年轻化需求增长,“抗衰老”已成为社会焦点。我国抗衰市场自2016年起以17%复合增速快速增长,2024年规模突破2300亿元。抗衰内涵从表面修饰向深度干预演进,口服抗衰因安全有效被广泛接受。中科院上海有机所与莱特维健共建研究中心,聚焦麦角硫因等前沿成分研发,推动口服抗衰产品创新升级,开启健康抗衰新纪元。

  • AI日报:海螺AI首尾帧功能上线;元石科技发布问小白5;OpenAI发布全新语音模型GPT-Realtime

    AI日报栏目每日提供人工智能领域热点内容,聚焦开发者,帮助洞悉技术趋势、了解创新AI产品应用。最新动态包括:MiniMax海螺AI首尾帧功能上线;元石科技发布问小白5挑战GPT-5;OpenAI推出语音模型GPT-Realtime;谷歌Gemini AI优化表格处理;腾讯黑科技实现AI配音;百度计划培养千万AI人才;MathGPT.ai反作弊功能推广;苹果Xcode集成Claude Sonnet4;微软发布自研AI模型MAI系列;xAI推出高效编码模型Grok Code Fast1;SuperCLUE多模态评测Gemini-2.5-Pro居首;9月1日起AI内容标识新规实施,违规将承担法律风险。

  • OpenAI发布语音模型GPT-realtim:具备情感感知能力 多语言无缝切换

    OpenAI正式发布语音模型GPT-realtime。 据介绍,GPT-realtime是一款专注于语音AI Agent的多模态模型,能够生成高度自然流畅的语音,精准还原人类语调、情感和语速的丰富变化。该模型支持图像理解,并可结合语音或文本对话使用,非常适合应用于客服、教育、金融、医疗等领域,用于构建高质量的语音智能体。 官方表示,新模型在复杂指令遵循、工具精确调用以及生成更自然、�

  • 汪喵灵灵亮相亚宠论坛,AI大模型破解异宠医疗资源困局

    2025年亚洲宠物展“亚洲小宠生态论坛”近日举办,汪喵灵灵创始人Luke受邀出席,分享AI宠物医疗大模型如何解决行业资源短缺、推动服务普惠化。该平台覆盖20多种宠物诊疗,通过解析海量文献建立健康档案系统,提供免费问诊与科学养护建议,降低养宠门槛。2024年已通过国家算法备案,成为业内首个合规认证的宠物健康大模型,致力于让每只宠物享有平等医疗关怀。

  • 美团也开源了大模型,但我觉得他们的野心是通用生活Agent。

    也有线上体验地址:https://longcat.ai 我自己去体验了一下,整体模型能力,中规中矩,但是快,是真的快,能把560B的模型,在推理的时候搞得这么快,是真的有点牛逼的。 我直接录了个屏给大家看一下。 这里我们可以直观对比一下LongCat和DeepSeek V3的输出速度,他俩都是MoE架构,而且总参数量差不太多。 为了更公平的竞争,用了同一个问题,并关闭了联网搜索来避免搜索干扰�

  • AI日报:苹果明年推出SiriAI搜索;OpenAI放开ChatGPT Projects功能;Kimi K2-0905 上线 Discord

    本文汇总了AI领域最新动态:苹果与谷歌合作,计划在Siri中引入Gemini AI技术;OpenAI向免费用户开放Projects功能,提升任务管理效率;谷歌推出免费Gemini CLI工具,集成GitHub提升开发效率;OpenAI估值飙升至5000亿美元,二级股票售出103亿美元;苹果自研AI搜索引擎“世界知识问答”计划2026年上线;月之暗面发布Kimi K2-0905模型,提升编程与创意写作能力;Raycast推出Cursor Agent插件优化代码编辑;谷歌发布nano banana官方Prompt模板,助力创意设计。

  • 百度首批签署联合国“创建可持续品牌”愿景倡议

    9月4日,百度作为中国领先企业代表,在联合国日内瓦万国宫举办的“创建可持续商业与品牌”高级别对话会上,首批签署“创建可持续品牌”愿景倡议。该倡议由联合国贸易和发展会议、联合国可持续标准论坛等机构联合主办,旨在推动全球商业与品牌的可持续发展。百度此举体现了其在可持续发展领域的领先地位,也为中国企业深度融入全球可持续商业生态树立了典范。

  • 亚马逊CPF团队到访绿舟,为何选择绿舟?

    亚马逊CPF团队近日访问绿舟,高度认可其在绿色认证领域的专业能力,并释放出对绿色产品大力扶持的信号。绿舟作为亚马逊SPN首批CPF服务商,已服务超70%头部跨境卖家,提供从认证咨询到售后维护的全流程服务。调研显示,绿色产品流量增长显著,欧盟市场销量增幅达15%。未来亚马逊将持续推进CPF计划,与绿舟携手赋能卖家低碳转型,共同驶向绿色增长的蓝海。

今日大家都在搜的词: