首页 > 传媒 > 关键词  > 正文

度小满金融大模型C-Eval、CMMLU双榜排名,正式开源!

2023-09-26 10:47 · 稿源: 站长之家用户

9 月 22 日,度小满宣布“轩辕70B”金融大模型开源,所有用户均可自由下载和试用,并公布了“轩辕70B”在C-Eval、CMMLU两大知名大语言模型评测基准的成绩。数据显示, 在C-Eval榜单上,XuanYuan-70B的总成绩达到71. 9 分;在CMMLU榜单中,以71. 05 分的高分位居榜首,在两大榜单上的所有开源模型中排名居首,也是国内首 个同时在两大榜单排名居首的金融大模型。

C-Eval榜单是由清华大学、上海交通大学和爱丁堡大学合作构建的综合性考试评测集,几乎囊括了所有国内外的主流模型,覆盖人文、社科、理工、其他专业四个大方向的 52 个学科,共有 13948 个多项选择题和中学、本科、研究生、职业等四个难度级别,是目前对模型潜力判断备具权 威性的大模型榜单之一。

CMMLU 数据集是一个综合性的中文评估基准,由MBZUAI、上海交通大学、微软亚洲研究院共同推出,专门用于评估语言模型在中文语境下的知识和推理能力,共涵盖了 67 个主题,涉及自然科学、社会科学、工程、人文以及常识等。

金融行业场景丰富,数字化程度高,是大模型落地应用的最 佳场景之一。但金融又是一个高合规要求的行业,业务决策复杂,大模型真正在金融业务中做到实际应用还面临不少挑战。

度小满CTO许冬亮表示,“相比通用大模型,‘轩辕70B’金融大模型经过度小满业务场景中沉淀的海量金融数据训练,对金融知识理解更专业、更准确,可控性、安全性更高。我们把大模型开源,希望能够降低大模型在金融行业的部署和应用门槛,促进金融行业服务效率和服务体验的突破性革新”。

“轩辕70B”将在社区同时开源金融大模型和50G高质量金融语料。

今年 5 月份,度小满开源了国内首 个千亿参数的金融大模型,已经有上百家金融机构申请试用。本次发布的新版大模型相较于上一个版本能力全面提升:在增量预训练和指令微调阶段,加入了度小满业务场景中的海量金融数据,对金融问题回复更专业,金融知识理解能力提升明显;同时在预训练阶段,"轩辕70B”的模型上下文长度扩充到8k,能够处理更长的金融报告、研究和分析。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看

今日大家都在搜的词:

热文

  • 3 天
  • 7天