首页 > 业界 > 关键词  > 金融最新资讯  > 正文

DISC-FinLLM:解决中国金融领域挑战的多专家微调语言模型

2023-11-10 14:05 · 稿源:站长之家

站长之家(ChinaZ.com)11月10日 消息:自然语言处理(NLP)领域的最大进展是引入了大型语言模型(LLM)。这些基于NLP的模型处理大型复杂数据集,因此在金融行业面临着独特的挑战。传统金融NLP模型的领域,如金融文本摘要、股价预测、财务报告生成、新闻情绪分析和金融事件提取等都取得了进展。

但随着金融数据量和复杂性不断上升,LLMs面临一系列挑战,包括缺乏人工标记数据、缺乏特定金融领域的专业知识、多任务处理的困难、数值计算的约束以及无法处理实时信息等。

image.png

项目地址:https://github.com/fudandisc/disc-finllm

然而,在中国金融市场等行业中,LLMs缺乏对金融行业的深入理解,这使得开发适用于各种用户类型和情境设置的开源中国金融LLMs非常重要。为了解决这一问题,一组研究人员引入了DISC-FinLLM,这是一种创建中国金融LLMs的全面方法。

这种方法的主要目的是为LLMs提供技能,使它们能够生成和理解金融文本,就金融问题进行多轮对话,并通过插件功能协助金融建模和知识增强系统。该团队还开发了一个监督指导数据集,称为DISC-FIN-SFT。

DISC-FinLLM的主要目标是通过多专家微调框架提供技能,使其能够生成和理解金融文本,进行多轮对话,并通过插件功能协助金融建模和知识增强系统。为了构建DISC-FinLLM,研究团队开发了监督指导数据集DISC-FIN-SFT,其中包含金融咨询、任务执行、金融计算和信息检索等方面的指导。

DISC-FinLLM相对于基础模型在各种金融任务中更具性能优势,通过多专家微调框架,DISC-FinLLM能够适应金融多轮对话、NLP任务、金融计算和信息检索等多个场景,为学生、开发者和金融专业人士等不同用户群体提供多样化服务。

研究团队对DISC-FinLLM进行的多次评估,并强调了该模型在各种金融场景和任务中的出色表现。总体而言,DISC-FinLLM代表了对中国金融领域需求的创新回应,为LLMs在特定领域应用提供了一种全面而有效的方法。

举报

  • 相关推荐
  • 苹果自研AI模型难产:改用第三方大语言模型

    苹果可能会跟OpenAI或Anthropic合作,双方正在谈判讨论一项潜在交易,苹果希望调用OpenAI或Anthropic的第三方大语言模型来为Siri提供技术支持。 据悉,OpenAI或Anthropic正在训练适配苹果私有云计算服务器的模型,苹果也在进行测试,目前苹果发现Anthropic的AI模型最适合Siri,且与Anthropic初步讨论了一些财务条款,消息称Anthropic要求苹果每年支付数十亿美元的费用,且该费用会随时间�

  • AI日报:腾讯混元推3D生成大模型Hunyuan3D-PolyGen;钉钉AI表格重磅来袭;阿里推多模态大语言模型HumanOmniV2

    本文介绍了AI领域多项重要进展:1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen,显著提升建模效率;2)阿里发布多模态大模型HumanOmniV2,准确率达69.33%;3)钉钉AI表格实现1小时处理千项任务;4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级;5)微软推出Deep Research智能体,自动化研究流程;6)香港理工与OPPO联合开源视频超清框架DLoRAL;7)谷歌开源MCP工具箱简化AI与数据库集成;8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。

  • 国内首个!高德地图正式上线多语言地图:新增14种语言

    日前,高德地图正式上线多语言地图,在原有的中英文基础上,新增多达14种语言。 这14种语言包括西班牙语、葡萄牙语、法语、德语、泰语、日语、韩语、土耳其语、意大利语、俄语、阿拉伯语、马来语、印尼语、越南语。 此次多语言版的推出,使更多非英语国家的用户也能享受高德地图提供的优质出行服务。 高德地图多语言版实现了产品界面与地理信息的多语种适配,�

  • 模型推理协作正式开启,魔乐社区让模型跑遍“中国芯”

    魔乐社区启动"模型推理适配协作计划",旨在解决国产算力平台与大模型间的适配难题。该计划通过开源协作模式,联合开发者、芯片厂商等生态伙伴,构建从工具链到知识库的全栈支持体系,打造适配成果共享平台。重点支持开源大模型在国产硬件及多样化推理引擎上的高效运行,提供模型转换工具和优化指南,降低开发门槛。目前已有文心大模型4.5等首批适配成果�

  • 专家:热射病不能大量喝冰水 或致严重后果

    近日,河南一名37岁的快递员因患热射病不幸去世,引发社会广泛关注。据其家属透露,事发当天最高气温接近40℃,快递员中午回家时已感身体不适,但仍喝了些冰饮料后继续出门工作,不料下午便晕倒在电动车上,最终未能抢救成功。 针对这一悲剧,专家特别提醒,热射病并非普通中暑,其严重性不容小觑。贾大成指出,热射病是一种致命性急症,主要表现为高热(直肠�

  • 国内有哪些ai大模型?一文看懂中国核心AI大模型全景

    近两年中国AI大模型发展迅猛,已形成"通用+行业"双轨并进的生态格局。百度文心一言、阿里通义千问等通用大模型在中文理解、多模态生成等方面表现突出;深度求索DeepSeek以1/10参数实现GPT-4级推理能力;月之暗面Kimi以20万汉字上下文窗口领跑长文本处理;智谱AI的GLM-4成为首个支持视频对话的国产千亿模型。医疗、金融等垂直领域涌现出百川智能等专业模型,覆盖超1000家医院。开源生态加速国产芯片适配,15家厂商完成深度优化。行业应用方面,工程文档效率提升60%,24小时拟人化客服等案例凸显价值。未来趋势呈现模型蒸馏、端侧部署和开源生态三大方向,中国AI正从实验室走向产业变革前沿。

  • 专家称热射病不能大量喝冰水:非普通中暑

    据媒体报道,正值七月盛夏,全国多地持续高温,热射病病例频发。专家强调,热射病绝非普通中暑,而是一种核心体温超过40℃、伴随多器官衰竭的致命急症,其病死率高达50%以上,必须引起高度重视。 在高温环境下,剧烈运动是导致热射病的主要原因。当气温超过35℃、湿度超过60%时,人体散热效率会显著下降。此时若进行剧烈运动,体内产热与散热严重失衡,核心体温�

  • 英伟达Blackwell Ultra芯片商用落地,微美全息以“算力+开源”领航AI科技新程

    英伟达与CoreWeave合作推出新一代AI芯片Blackwell Ultra,该芯片已实现商业部署,采用液冷技术,包含72个GPU和36个CPU。Blackwell Ultra的AI内容生成能力是前代产品的50倍,预计今年批量出货。英伟达凭借高性能AI芯片近乎垄断市场,年利润超5000亿元,市值逼近4万亿美元,有望成为全球市值最高公司。微软推迟自研AI芯片发布,转向过渡性设计方案。微美全息专注AI芯片技术布局,构建多元化技术生态,推动产业协同,成为全球AI芯片竞赛重要参与者。当前AI产业进入大规模商业化关键阶段,算力需求持续高涨,推动企业向算力数智化迁移。消费电子领域,AI赋能传统智能终端,新型智能硬件结合AI创造增量需求,关注算力产业链技术创新配套机遇。

  • 当 CODING 宣布其 DevOps 产品停服计划时,国内软件研发工具行业的平静被彻底打破

    腾讯旗下CODING DevOps平台将于2024年9月起逐步停服,极狐GitLab迅速推出专属迁移福利争夺用户。其优惠政策包括:首年订阅超低折扣(SaaS团队版300元/人)、免费代码仓库迁移服务、社区版用户专属折扣及3个月企业版试用权益。此举直击用户迁移痛点,降低经济门槛和操作风险。极狐凭借"中外合作3.0"模式在中国市场快速崛起,已与沃尔玛、理想汽车等企业建立成功合作案例。这场用户争夺战将加速国内研发工具行业洗牌,推动平台提升智能化服务和生态建设,最终使开发者获得更高效的工具选择。

  • TikTok电商抢滩日本,有哪些机遇和挑战?

    ​TikTok电商全球化布局再落一子。 6月30日,TikTok正式在日本上线电商业务,核心模式为直播带货。品牌、卖家及创作者可通过发布含购物功能的视频或直播,在TikTok内直接销售商品。 在东南亚、美区等市场,TikTok电商已证明了其直播带货模式的爆发力。如今全球化布局再下一城,给从业者带来了哪些新的机遇和挑战? TikTok Shop在日本上线 早在4月28日,TikTok日本正式宣布推出