首页 > 热点 > 关键词  > 正文

元象开源70亿参数通用大模型 XVERSE-7B 免费可商用

2023-09-27 08:30 · 稿源:站长之家

站长之家(ChinaZ.com)9月27日 消息:元象宣布开源70亿参数通用大模型 XVERSE-7B 底座与对话版,这是一款全开源、免费可商用的模型。

相比之前的 XVERSE-13B,7B 版本更小巧,可以在单张消费级显卡上运行,并且推理量化后最低只需6GB 显存,大大降低了开发门槛和推理成本。

该模型在多项权威测试中表现出色,并具有强大的认知、规划、推理和记忆能力,支持40多种语言。

微信截图_20230927083215.png

XVERSE-7B是在2.6万亿 tokens 高质量多语言数据上从头训练的底座模型,具有强大的认知、规划、推理和记忆能力。其上下文窗口长度为8192,支持中、英、俄、法等40多种语言。

XVERSE-7B-Chat是底座模型经 SFT 指令精调后的中英文对话模型,大幅提升了理解和生成内容的准确度,也更符合人类的认知偏好。

项目地址:

XVERSE-7B:

https://modelscope.cn/models/xverse/XVERSE-7B

XVERSE-7B-Chat:

https://modelscope.cn/models/xverse/XVERSE-7B-Chat

XVERSE-13B:

https://modelscope.cn/models/xverse/XVERSE-13B

XVERSE-13B-Chat:

https://modelscope.cn/models/xverse/XVERSE-13B-Chat

举报

  • 相关推荐
  • 开源标杆!最强中英双语大模型来了,340亿参数,超越 Llama2-70B等所有开源模型

    开源界最强的中英双语大模型,悟道·天鹰34B,来了!有多强?一言蔽之:不仅模型够大够能打还一口气送上整套“全家桶”级豪华周边。能有如此大手笔的,正是中国大模型开源派先锋——智源研究院。Aquila2模型全系开源地址:https://github.com/FlagAI-Open/Aquila2https://model.baai.ac.cn/https://huggingface.co/BAAIAquilaSQL开源仓库地址:https://github.com/FlagAI-Open/FlagAI/tree/master/examples/Aquila/Aquila-sqlFlagAttenti

  • 度小满“轩辕70B”金融大模型开源

    度小满推出全新的金融行业大模型“轩辕70B”,标志着金融大模型迈向新的高度。该模型在通用能力和专业金融领域表现出色,名列各项开源模型评测榜单前列,特别在中文任务评测和金融领域十大类权威考试方面提供专业支持。5.对话能力:XuanYuan-70B-Chat模型经过通用和金融指令微调,具备出色的对话生成能力,可以用于生成金融领域的文本摘要以及回答各种问题。

  • 什么值得买:正在基于通用大模型开发“值得买消费内容大模型

    值得买表示,大数据和大模型是公司非常关注的领域,公司已经在该领域加大了投入。在大数据层面,目前随着公司逐步沉淀来自于消费内容业务板块和营销服务业务板块等的更多数据资源,已形成一个能够涵盖人、货、场等多种维度的底层数据体系。在大模型领域,公司正在基于通用大模型,开发“值得买消费内容大模型”,同时也正在探索各种基于“值得买消费内容大模�

  • 34B参数量超越GPT-4!「数学通用大模型」MAmmoTH开源:平均准确率最高提升29%

    数学通才「猛犸」模型给开源语言模型带来了「推理春天」,面对GPT-4都有一战之力!数学推理问题是语言模型绕不过的痛点,在各种黑科技的加持下,开源模型的推理性能依然不够看。滑铁卢大学、俄亥俄州立大学、香港科技大学、爱丁堡大学的研究人员联合开源了一个专为「通用数学问题」定制的大模型MAmmoTH和一个指令调优数据集MathInstruct.论文链接:https://arxiv.org/pdf/2309.05653

  • 生数科技发布自研多模态通用大模型 同时推出PixWeaver、VoxCraft等工具

    9月20日,生数科技发布了自主研发的多模态通用大模型,并同时推出了两款应用产品:视觉创意设计平台PixWeaver和3D资产创建工具VoxCraft。生数科技的多模态通用大模型采用底层融合的思路,将Transformer架构引入扩散模型,实现文本、图像、3D、视频等多模态知识的融合。生数科技的大模型还面向游戏制作、影视制作、广告营销等多个行业提供服务能力,支持各类创意内容的生成。

  • 国产开源新标杆!20B大模型,性能媲美Llama2-70B,单卡可推理

    国产新标杆:免费可商用的200亿参数大模型,来了!书生·浦语大模型20B版本正式发布,一举刷新国内新一代大模型开源纪录。它由上海人工智能实验室与商汤科技联合香港中文大学和复旦大学共同推出。正如林达华所说:这或许才是当下大模型趋势里,大家最应该“卷”的方向。

  • 20B量级大模型性能媲美Llama2-70B!完全开源,从基座到工具全安排明白了

    【新智元导读】国产模型开源纪录,又被刷新了!上海AI实验室等机构开源的InternLM-20B,竟然能和Llama2-70B打个平手?就在刚刚,国内开源模型参数量纪录,又被刷新了!9月20日,上海人工智能实验室与商汤科技联合香港中文大学和复旦大学,正式开源了200亿参数的InternLM-20B模型。项目地址:https://github.com/InternLM/InternLM魔搭社区:https://modelscope.cn/organization/Shanghai_AI_Laboratory这次的200亿参数版书生·浦语大模型,可以说是「加量不加价」,参数量还不到三分之一,性能却可以剑挑当今开源模型的标杆——Llama2-70B。上海AI实验室的「雪中送炭」,必然会让大模型在落地领域发挥出巨大的价值。

  • 中文LLaMA-2刷榜,开源商用!千预算,训练半天,效果媲美主流大模型

    最强中文版LLaMA-2来了!15小时训练,仅需数千元算力,性能碾压同级中文汉化模型,开源可商用。LLaMA-2相较于LLaMA-1,引入了更多且高质量的语料,实现了显著的性能提升,全面允许商用,进一步激发了开源社区的繁荣,拓展了大型模型的应用想象空间。ColossalAI云平台现已开启公测,注册即可获得代金券,欢迎参与并提出反馈。

  • 清华等开源多智能体框架AgentVerse 可让多个模型之间进行协作

    AgentVerse是一个旨在促进多个大型语言模型之间协作的多智能体框架。虽然单个LLM在各种任务上表现出色,但面对复杂任务或需要提高效率的情况,多个智能体之间的协作变得至关重要。这一框架的发展对于推动自然语言处理和人工智能领域的研究和应用具有重要意义。

  • 开源大模型正在“杀死”闭源?

    “OpenAI不足为惧,开源会慢慢赶上来。”彼时HuggingFace创始人ClemDelangue的一句预言,正在迅速成为现实。这也足以说明,开源还是闭源,或许只是阶段和位置的不同,但可以肯定的是,大模型时代,已经加速进入下一赛段。