度小满“轩辕70B”金融大模型开源

2023-09-25 14:22 · 稿源：站长之家

站长之家(ChinaZ.com) 9月25日消息:度小满推出全新的金融行业大模型“轩辕70B”，标志着金融大模型迈向新的高度。该模型在通用能力和专业金融领域表现出色，名列各项开源模型评测榜单前列，特别在中文任务评测和金融领域十大类权威考试方面提供专业支持。

“轩辕70B”是一个重要的金融对话大模型项目，旨在提供卓越的自然语言处理能力。该项目构建在Llama2-70B模型的基础上，经过中文增强和大量通用与金融领域的预训练，形成了一系列强大的金融大模型。

项目地址:https://github.com/Duxiaoman-DI/XuanYuan

“轩辕70B”是首个拥有70B参数量级和上下文长度可达8k以上的开源大模型。它在预训练阶段融入了大量的专业金融语料，旨在提高通用能力的同时显著增强金融专业性能。模型训练采用了一系列加速优化策略，具备出色的训练效率。

这一模型已经在开源社区全面开放，包括模型权重和训练语料，为金融行业提供了一个高效的中文基座模型，用户还可以根据需要进行自定义的微调。这一创新将有助于金融领域的自然语言处理和信息抽取等任务，为行业发展带来新的机遇。

核心功能:

1. 中文增强:XuanYuan-70B基于Llama2-70B模型进行了中文增强，通过大量通用与金融领域数据的预训练，扩充了中文词表，大幅提升了金融领域的理解能力。

2. 上下文长度扩展:为满足金融领域的长文本需求，XuanYuan-70B在预训练阶段将上下文长度扩展到了8k和16k，这是首个在70B参数级别上实现如此高上下文长度的开源大模型。

3. 通用能力:该模型在通用能力评测中表现出色，不仅在英文评测数据上表现优秀，还在多种中文评测数据集上表现出众，涵盖了STEM、人文学科、社会科学等领域。

4. 金融领域应用:XuanYuan-70B在金融领域评测中取得显著的提升，这使得它成为处理金融领域文本的理想选择。

5. 对话能力:XuanYuan-70B-Chat模型经过通用和金融指令微调，具备出色的对话生成能力，可以用于生成金融领域的文本摘要以及回答各种问题。

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
荐苹果开源OpenELM，大模型开源领域再迎一巨头！

4月24日，苹果开源了大语言模型OpenELM。这与微软刚开源的Phi-3Mini类似，是一款专门针对手机等移动设备的模型。这次苹果真的是很有诚意的开源，一开到底所有内容都贡献出来了，家大业大就是敢玩。

OpenELM 开源
荐大模型开源还是闭源好，周鸿祎与李彦宏针尖对麦芒

开源大模型还是闭源大模型，究竟谁才是“版本答案”?围绕这个问题，360创始人周鸿祎和百度创始人李彦宏最近就来了一次隔空论战。先是在4月12日，有媒体曝光了李彦宏在百度内部的讲话。大模型到底是开源好、还是闭源更佳，目前在技术层面暂时还没有分出高下，但闭源或开源对于不同公司的商业利益却各有优劣。

大模型周鸿祎李彦宏
李彦宏称大模型开源意义不大周鸿祎：说这话的公司都是靠开源发展的

在近日的一次内部讲话中，百度董事长李彦宏给开源大模型泼了不少冷水。李彦宏认为，大模型开源的意义不大，闭源模型在成本和能力上会持续领先。其实你仔细听听李彦宏说的是有道理的，他是说在写古诗方面，百度超过了GPT4，”周鸿祎的这番言论也引发了现场轰笑。

百度开源大模型大模型开源
孟子3-13B大模型正式开源

澜舟科技近日宣布，其研发的孟子3-13B大模型正式开源，并向学术研究领域全面开放，同时支持免费商用。这一轻量化大模型在多项基准测试中展现了优异的性能，特别是在参数量20B以内的模型中，其中英文语言能力尤为突出，数学和编程能力也位于行业前列。这一举措无疑将推动大模型技术的发展和应用，为AI产业的进步贡献力量。

大模型 AI头条
阿里刚开源32B大模型，我们立马测试了“弱智吧”

阿里的通义千问，终于拼齐了1.5系列的最后一块拼图——正式开源Qwen1.5-32B。直接来看“成绩单”。GQA的引入就降低了注意力计算的数量，从加速了推理时间。

阿里大模型 Qwen1.5
荐7B超越百亿级，北大开源aiXcoder-7B最强代码大模型，企业部署最佳选择

大语言模型集成至编程领域、完成代码生成与补全任务成为重要趋势。业界已经出现了一批引人瞩目的代码大模型，比如OpenAI的CodeX、谷歌DeepMind的AlphaCode、HuggingFace的StarCoder，帮助程序员更迅捷、更准确、更高质量地完成编码任务，大幅提升效率。aiXcoder也因其极具前瞻性的探索方向、踏踏实实的落地实践，不断受到资本市场的追捧，高瓴、清流、彬复等极具行业引领性的基金

aiXcoder-7B 大模型
360智脑7B参数大模型正式开源最长支持约50万字输入

360公司自主研发的7B参数大模型——360智脑，现已正式上线开源社区，并提供了基础模型以及4K、32K、360K三种不同文本长度的版本。这一大模型在支持文本长度方面表现出色，最长可处理360K长文本，相当于约50万字的输入内容。在中英文360K大海捞针效果测试中，也取得了超过98%的高分。

大模型文本长度开源社区
蚂蚁集团等发布开源大模型知识抽取框架OneKE

蚂蚁集团和浙江大学合作开发了一个名为OneKE的开源大模型知识抽取框架。该框架旨在帮助处理信息抽取、文本数据结构化和知识图谱构建等任务，为研究人员和开发者提供有力工具。他们将持续优化知识抽取的性能，并将相关技术应用到金融、医疗、政务等领域，推动可控生成技术的产业落地。
北大开源最强aiXcoder-7B代码大模型专为企业级软件开发场景设计

在当今科技快速发展的时代，AI代码生成技术正逐渐成为软件开发领域的热门话题。尽管AI在解决编程问题方面表现出色，但在真实的企业开发环境中，其应用似乎还不够理想。随着代码大模型能力的日益增强，我们有理由相信，aiXcoder-7B将为程序员们带来更多的创新潜能，推动编程自动化的浪潮向前发展。

aiXcoder-7B AI头条
百度智能云发布千帆大模型一体机：预置十余个主流开源大模型

在百度智能云GENERATE全球生态大会上，百度智能云发布千帆大模型一体机，从算力资源角度分为通用版、昇腾版、昆仑芯版三个版本，为企业私有化部署大模型提供解决方案。千帆大模型一体机预置了百度自研的文心大模型，以及Llama、Baichuan、ChatGLM等十余个主流开源大模型。过去6个月，百度智能云生态伙伴的数量增长了5倍，伙伴们开发的300多款应用通过千帆应用商店”进入市场。

百度智能云 GENERATE全球生态大会千帆大模型一体机

今日大家都在搜的词：

热文

3 天
7天

度小满“轩辕70B”金融大模型开源

今日大家都在搜的词：

热文

站长商机