首页 > 业界 > 关键词  > 大模型最新资讯  > 正文

度小满“轩辕70B”金融大模型开源

2023-09-25 14:22 · 稿源:站长之家

站长之家(ChinaZ.com) 9月25日 消息:度小满推出全新的金融行业大模型“轩辕70B”,标志着金融大模型迈向新的高度。该模型在通用能力和专业金融领域表现出色,名列各项开源模型评测榜单前列,特别在中文任务评测和金融领域十大类权威考试方面提供专业支持。

“轩辕70B”是一个重要的金融对话大模型项目,旨在提供卓越的自然语言处理能力。该项目构建在Llama2-70B模型的基础上,经过中文增强和大量通用与金融领域的预训练,形成了一系列强大的金融大模型。

image.png

项目地址:https://github.com/Duxiaoman-DI/XuanYuan

“轩辕70B”是首个拥有70B参数量级和上下文长度可达8k以上的开源大模型。它在预训练阶段融入了大量的专业金融语料,旨在提高通用能力的同时显著增强金融专业性能。模型训练采用了一系列加速优化策略,具备出色的训练效率。

这一模型已经在开源社区全面开放,包括模型权重和训练语料,为金融行业提供了一个高效的中文基座模型,用户还可以根据需要进行自定义的微调。这一创新将有助于金融领域的自然语言处理和信息抽取等任务,为行业发展带来新的机遇。

核心功能:

1. 中文增强:XuanYuan-70B基于Llama2-70B模型进行了中文增强,通过大量通用与金融领域数据的预训练,扩充了中文词表,大幅提升了金融领域的理解能力。

2. 上下文长度扩展:为满足金融领域的长文本需求,XuanYuan-70B在预训练阶段将上下文长度扩展到了8k和16k,这是首个在70B参数级别上实现如此高上下文长度的开源大模型。

3. 通用能力:该模型在通用能力评测中表现出色,不仅在英文评测数据上表现优秀,还在多种中文评测数据集上表现出众,涵盖了STEM、人文学科、社会科学等领域。

4. 金融领域应用:XuanYuan-70B在金融领域评测中取得显著的提升,这使得它成为处理金融领域文本的理想选择。

5. 对话能力:XuanYuan-70B-Chat模型经过通用和金融指令微调,具备出色的对话生成能力,可以用于生成金融领域的文本摘要以及回答各种问题。

举报

  • 相关推荐
  • 机器人伴侣仅限成人购买使用:内置养成系专属情感大模型

    上线仅10天,主打情感陪伴的人形机器人U1为优必选收获了超过3800台预售订单,对应定金总额逾千万元。对于去年仅售出1079台人形机器人的优必选而言,这次尝试已算小有突破”。 U1系列分男女两款机型:男款身高183厘米、重42公斤;女款身高168厘米、重35.2公斤。 两款均支持Wi-Fi连接,单次充电续航2至4小时,无3C”认证,配备88个高自由度运动关节,搭载养成系”情感大模型

  • 卓世科技入选“2026 AI科技小巨人TOP50”,以行业大模型与具身智能大脑构筑AI产业新底座

    近日,互联网周刊与德本咨询联合发布“2026AI科技小巨人TOP50”榜单,卓世科技(海南)凭借行业大模型研发、具身智能通用大脑搭建及全栈智能体执行引擎等硬核实力成功登榜。公司坚持“AI普惠”理念,打造“璇玑玉衡”千亿参数大模型体系,并首创Tri-Core三核协同具身智能通用大脑架构,破解行业痛点。同时推出NextClaw(龙虾)全栈执行引擎及OPC数字员工,实现从云端认知到物理世界执行的全链路打通,推动AI从“虚拟智能”向“物理AI”跨越。

  • 最强AI大模型Fable 5、Mythos 5发布:人类智力优势还能撑多久

    Anthropic发布基于Mythos Preview的Claude Fable 5和Mythos 5两款AI模型,自称最强,在多项测试中达SOTA水平。Fable 5面向公众开放,保留安全运制;Mythos 5无运制但仅限审核机构使用。两者性能卓越,尤其在编程方面提升明显,但存在定价昂贵(1M输入/输出分别需10/50美元)、安全运制敏感(触发即降级至Opus 4.8)及强制30天安全审计等问题,影响商业用户使用。

  • 超节点提效30%!华为官宣昇腾亲和大模型:6月30日开源上线

    华为开发者大会(HDC 2026)上,华为常务董事、终端BG董事长余承东在大会主题演讲中宣布,推出昇腾亲和大模型,覆盖算法架构到训练推理全流程。 昇腾亲和大模型是业界首个DSA SWA独立分层混合架构。针对MoE(混合专家)模型专家路由问题进行了专项优化。 昇腾原生训练实现双重性能提升,训练效率提升30%,512K长序列训练吞吐提升50%

  • AI日报:MiniMax发布M3 大模型;英伟达物理大模型Cosmos3发布;小红书已治理超120万个AI托管账号

    今日AI领域动态丰富:MiniMax发布M3+大模型,首创MSA架构并支持1M上下文,全面开源对标海外旗舰;英伟达联合行业巨头发布全球首款全开源全模态物理AI大模型Cosmos3,成立宇宙联盟;千问APP六一期间礼品选购咨询量增长260%,展现AI购物潜力;小红书治理超120万AI托管账号,处置18万篇AI造假笔记;抖音4月新增AI短剧超4.4万部,但爆款率仅0.6%;胡彦斌上线粉丝社区应用“彦火”,展示Vibe Coding潜力;LobsterAI推出图片视频大模型矩阵,整合四大主流模型;OpenAI重启机器人业务,奥特曼公开招募工程师,拓展具身智能布局。

  • 8GB内存成硬伤!iPhone 17无缘苹果最强端侧AI大模型

    根据苹果官方硬件适配细则,iPhone 17标准版和满血版因仅配备8GB内存,无法达到12GB门槛,无缘端侧AI大模型。目前仅iPhone Air、iPhone 17 Pro及Pro Max三款机型可完整体验。博主透露,苹果后续可能调整策略,下一代iPhone 18系列或全系标配12GB内存,以从根源满足端侧大模型需求,避免基础款用户被核心功能割裂。12GB内存将大幅强化本地AI推理速度,支持更复杂多模态任务,并降低对云端的依赖,提升数据隐私保护。

  • 大模型驱动算力需求扩容 寒武纪产品落地多行业

    大模型技术持续迭代推动智能计算需求高速增长,为上游智能芯片赛道带来广阔发展空间。寒武纪作为全球知名AI芯片公司,产品覆盖云、边、端智能芯片及板卡、智能整机、处理器IP和软件,满足不同规模AI计算需求。其云端智能芯片是数据中心核心器件,提供高算力、高效能硬件资源;智能整机与计算集群系统分别面向不同客户群体,产品已在运营商、金融、互联网等行业规模化部署。2025年,寒武纪云端产品线收入64.77亿元,同比大幅增长,将持续深耕核心赛道,提升市场占有率。

  • 美团Tabbit AI浏览器正式版上线:核心功能永久免费!整合主流国内大模型

    美团正式发布Tabbit AI浏览器1.0标准版,结束100天公测,全面开放下载,支持安卓、鸿蒙、苹果系统。该产品打破传统浏览器局限,通过整合DeepSeek、Kimi等多款国内主流大模型,实现AI全流程自动化任务处理,如搜索、筛选、执行等。新增记忆功能提升交互连贯性,内置300余种实用技能,覆盖学习、办公、生活等场景,并启动“妙招大赛”鼓励用户分享原创技能。

  • 小米超高端手机下半年发布:玄戒芯片+OS+AI大模型大会师!全自研

    小米将于下半年发布一款超高端新品,属于MIX系列,可能命名为MIX Fold 5,搭载自研玄戒O3旗舰SoC(3nm制程、超大核4.05Ghz等)、澎湃OS 4系统(底层重构提升流畅度)和自研MiMo大模型(MiMo-V2.5系列全球领先)。该产品并非小米17S Pro,而是新一代大折叠屏手机,此外MIX系列还规划了一款直板机,带模块化磁吸镜头量产方案,两款机型预计Q3发布,最快7月亮相。

  • 苹果满血AI大模型仅支持iPhone 17 Pro/Air:iPhone 17用户无缘

    苹果今天凌晨在WWDC2026开发者大会上正式发布了全新的Siri AI,这是一套完全由Apple Intelligence驱动的智能助理,相当于把过去几代的Siri完成了彻底重构。 据悉,Siri AI搭载了个人情境深度理解能力、覆盖海量信息的广泛世界知识库,还有实时屏幕感知能力,能随时协助用户找到自己需要的所有内容,不管是解答各类问题,还是从用户短信、电子邮件、照片等不同应用里精准提取�

今日大家都在搜的词: