首页 > 传媒 > 关键词  > 正文

度小满金融大模型C-Eval、CMMLU双榜排名,正式开源!

2023-09-26 10:47 · 稿源: 站长之家用户

9 月 22 日,度小满宣布“轩辕70B”金融大模型开源,所有用户均可自由下载和试用,并公布了“轩辕70B”在C-Eval、CMMLU两大知名大语言模型评测基准的成绩。数据显示, 在C-Eval榜单上,XuanYuan-70B的总成绩达到71. 9 分;在CMMLU榜单中,以71. 05 分的高分位居榜首,在两大榜单上的所有开源模型中排名居首,也是国内首 个同时在两大榜单排名居首的金融大模型。

C-Eval榜单是由清华大学、上海交通大学和爱丁堡大学合作构建的综合性考试评测集,几乎囊括了所有国内外的主流模型,覆盖人文、社科、理工、其他专业四个大方向的 52 个学科,共有 13948 个多项选择题和中学、本科、研究生、职业等四个难度级别,是目前对模型潜力判断备具权 威性的大模型榜单之一。

CMMLU 数据集是一个综合性的中文评估基准,由MBZUAI、上海交通大学、微软亚洲研究院共同推出,专门用于评估语言模型在中文语境下的知识和推理能力,共涵盖了 67 个主题,涉及自然科学、社会科学、工程、人文以及常识等。

金融行业场景丰富,数字化程度高,是大模型落地应用的最 佳场景之一。但金融又是一个高合规要求的行业,业务决策复杂,大模型真正在金融业务中做到实际应用还面临不少挑战。

度小满CTO许冬亮表示,“相比通用大模型,‘轩辕70B’金融大模型经过度小满业务场景中沉淀的海量金融数据训练,对金融知识理解更专业、更准确,可控性、安全性更高。我们把大模型开源,希望能够降低大模型在金融行业的部署和应用门槛,促进金融行业服务效率和服务体验的突破性革新”。

“轩辕70B”将在社区同时开源金融大模型和50G高质量金融语料。

今年 5 月份,度小满开源了国内首 个千亿参数的金融大模型,已经有上百家金融机构申请试用。本次发布的新版大模型相较于上一个版本能力全面提升:在增量预训练和指令微调阶段,加入了度小满业务场景中的海量金融数据,对金融问题回复更专业,金融知识理解能力提升明显;同时在预训练阶段,"轩辕70B”的模型上下文长度扩充到8k,能够处理更长的金融报告、研究和分析。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 度小满“轩辕70B”金融大模型开源

    度小满推出全新的金融行业大模型“轩辕70B”,标志着金融大模型迈向新的高度。该模型在通用能力和专业金融领域表现出色,名列各项开源模型评测榜单前列,特别在中文任务评测和金融领域十大类权威考试方面提供专业支持。5.对话能力:XuanYuan-70B-Chat模型经过通用和金融指令微调,具备出色的对话生成能力,可以用于生成金融领域的文本摘要以及回答各种问题。

  • 蚂蚁金融大模型已在理财和保险领域进行应用测试

    蚂蚁集团宣布联合信通院发布金融大模型行业标准。蚂蚁集团表示,8月底,蚂蚁金融大模型已通过证券从业资格、保险从业资格、执业医师资格、执业药师资格等专业试题测试。蚂蚁集团与金融机构合作的所有数字金融业务将全线接入这一大模型,助力合作机构数字化升级、智能化转型。

  • 度小满积极布局“NLP+金融”领域 提升业务创新与风控效率

    度小满在“NLP金融”的技术落地之路深耕多年,在NLP方面的积累显得尤为突出。大模型的兴起为金融领域的NLP应用打开了新的想象空间。度小满的成功实践证明了NLP技术在金融领域的巨大潜力,也为未来的金融智能化发展提供了有效方向。

  • 姜子牙大模型开源代码大模型Ziya-Coding-34B-v1.0

    IDEA研究院封神榜团队最近开源了最新的代码大模型Ziya-Coding-34B-v1.0,该模型在HumanEvalPass@1的评测上取得了75.5的好成绩,超过了GPT-4的得分。此次开源的Ziya-Coding-34B-v1.0,基于CodeLLaMA34B的预训练模型,经过了两个阶段的有监督精调,支持多种与代码相关的任务,包括代码生成、代码解释、代码纠错以及单元测试的生成等。

  • 开源大模型正在“杀死”闭源?

    “OpenAI不足为惧,开源会慢慢赶上来。”彼时HuggingFace创始人ClemDelangue的一句预言,正在迅速成为现实。这也足以说明,开源还是闭源,或许只是阶段和位置的不同,但可以肯定的是,大模型时代,已经加速进入下一赛段。

  • 度小满参与AIF系统试点 协同马上消费、美团共同打击代理维权黑产

    近日,全国首 个金融黑产打击系统平台—AIF黑产打击平台试运行期间,助力警方成功打击了一起非法代理维权团伙案,现场抓获犯罪嫌疑人 15 人。通过该平台,马上消费与度小满科技(北京)有限公司等AIF联盟成员单位碰撞出金融黑产线索,并会同美团安全部门对该线索进行分析和实地走访,发现吉林省某信息技术服务公司存在重大非法代理维权行为嫌疑。该公司伪装成正规专�

  • Riiid AI模型Sheep-duck-llama-2在HuggingFace排名第一

    AI教育解决方案领导者Riiid宣布,其最新生成式AI模型在知名机器学习模型平台HuggingFace上获得第一名。HuggingFace开放式大语言模型排名中,Riiid10月提交的最新模型“Sheep-duck-llama-2”获得了74.07分的高分,在全球500多个开源生成式AI模型中位居榜首。Riiid研究人员将继续开发新的模型架构,提升AI模型性能,并以实际数据验证学习影响,在国际AI会议上发表论文。

  • 阿里云通义千问140亿参数模型14B正式开源:十二测评全方位超越同规模SOTA大模型

    阿里云通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat正式开源,免费可商用。Qwen-14B在多个权威评测中超越同等规模模型,部分指标甚至接近Llama2-70B。过去两个月内,魔搭社区的模型下载量从4500万飙升到8500万,增幅接近100%。

  • To C大模型,亏钱也得干

    大模型的两条落地方向,虽南辕北辙但境遇相似。被寄予商业化落地厚望的是确定性较强的toB方向,只是目前看来还还击不穿成本的隔膜,定制化叙事背后的高人力、高资金成本阻碍业务向下普及,增量缓慢。刚刚彻底开放的大模型赛道迎来了智能助手这一赛点,其成熟与爆发很可能是新一轮的行业洗牌潮。

  • 超13万个大模型!微软增强ChatGPT等开源模型,训练、推理能力

    著名AI模型开源平台HuggingFace上有超过320,000个大模型,并且每天保持高速增长。据统计只有大约6,000个模型支持ONNX格式,但微软表示,实际上有超过130,000个模型支持该格式。在HuggingFace开源平台上还有10万个模型不支持ONNX格式,鼓励更多的技术研究机构、开源项目加入到ONNX社区,以通过ONNXRuntime增强开发效率。

热文

  • 3 天
  • 7天