首页 > 业界 > 关键词  > 正文

阿里云开源通义千问140亿参数模型Qwen-14B、Qwen-14B-Chat

2023-09-25 14:31 · 稿源:站长之家

站长之家(ChinaZ.com) 9月25日 消息:9月25日,阿里云开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,免费可商用。

据悉,Qwen-14B在多个权威评测中超越同等规模模型,部分指标甚至接近Llama2-70B。

微信截图_20230925143325.png

Qwen-14B是一款支持多种语言的高性能开源模型,相比同类模型使用了更多的高质量数据,整体训练数据超过3万亿Token,使得模型具备更强大的推理、认知、规划和记忆能力。

Qwen-14B-Chat 是在基座模型上经过精细SFT得到的对话模型。借助基座模型强大性能,Qwen-14B-Chat生成内容的准确度大幅提升,也更符合人类偏好,内容创作上的想象力和丰富度也有显著扩展。

目前,用户可从魔搭社区直接下载模型,也可通过阿里云灵积平台访问和调用Qwen-14B和Qwen-14B-Chat。

Qwen-14B-Chat

模型链接:https://modelscope.cn/models/qwen/Qwen-14B-Chat

Qwen-14B

模型链接:https://modelscope.cn/models/qwen/Qwen-14B

Qwen-14B-Chat-Int4

模型链接:https://www.modelscope.cn/models/qwen/Qwen-14B-Chat-Int4

举报

  • 相关推荐
  • 阿里云通义千问140亿参数模型14B正式开源:十二测评全方位超越同规模SOTA大模型

    阿里云通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat正式开源,免费可商用。Qwen-14B在多个权威评测中超越同等规模模型,部分指标甚至接近Llama2-70B。过去两个月内,魔搭社区的模型下载量从4500万飙升到8500万,增幅接近100%。

  • 开源标杆!最强中英双语大模型来了,340亿参数,超越 Llama2-70B等所有开源模型

    开源界最强的中英双语大模型,悟道·天鹰34B,来了!有多强?一言蔽之:不仅模型够大够能打还一口气送上整套“全家桶”级豪华周边。能有如此大手笔的,正是中国大模型开源派先锋——智源研究院。Aquila2模型全系开源地址:https://github.com/FlagAI-Open/Aquila2https://model.baai.ac.cn/https://huggingface.co/BAAIAquilaSQL开源仓库地址:https://github.com/FlagAI-Open/FlagAI/tree/master/examples/Aquila/Aquila-sqlFlagAttenti

  • 智源研究院开源中英双语大模型悟道·天鹰340亿Aquila2-34B

    智源研究院发布了最强开源中英双语大模型——悟道・天鹰340亿。这个新模型在推理、泛化等方面表现出色,在智能体、代码生成、文献检索等场景方面取得了一系列成绩。智源研究院还发布了FlagScale高效并行训练框架和FlagAttention高性能Attention算子集,进一步推动大模型研究的发展。

  • SambaNova发布全新AI芯片SN40L 可运行5万亿参数模型

    9月26日,位于加利福尼亚帕洛阿尔托的SambaNovaSystems公司宣布推出一款革命性的新芯片,名为SN40L。这款芯片将为SambaNova的全栈大语言模型平台SambaNovaSuite提供动力,并具有革命性的内部设计:在内部,它提供了密集和稀疏计算,同时包括大内存和快速内存,使其成为一款真正的“智能芯片”。还提供了推理优化系统,配备了3层数据流内存,以实现高带宽和高容量。

  • 龙芯桌面和服务器平台新增140款适配产品。

    2023年9月,龙芯桌面和服务器平台新增75家企业的140款适配产品。其中包括腾讯云计算、天融信、深信服等企业在内,产品涉及:业务系统37款、安全应用与系统36款、数据中台7款、云平台6款、软件存储4款、地理信息系统2款、其他产品48款。适配产品面向安全防护、金融证券、运维监控等多个领域。

  • 比GPT-4还强,20亿参数模型做算术题,准确率几乎100%

    大型语言模型在处理NLP领域的各种下游任务方面已经表现出卓越的能力。GPT-4、ChatGPT等开创性模型已经接受了大量文本数据的训练,使它们具备强大的文本理解和生成能力,能够生成连贯且上下文相关的响应,在各种NLP任务中具有高度通用性。为了评估模型在不同年级数学问题上的解决能力,该研究在K6数据集上测试评估了几种模型的性能,包括:GPT-4、ChatGPT、Chinese-Alpaca-13B、MOSS-16B、Ziya-LLaMA-13B、Baichuan-7B、ChatGLM-6B、ChatGLM2-6B和MathGLM-GLM-10B,结果如下图8所示。

  • 挑战GPT-4V!清华唐杰&智谱开源多模态14边形战士CogVLM-17B,在线可玩

    看看这张图中有几个房子?如果你回答3个,就和GPT-4V的答案一样。但是最新开源的国产多模态模型CogVLM-17B,就能看出另有玄机。不过目前仅支持英文,后续会提供中英双语版本支持,可以持续关注。

  • 融资1亿美元的类ChatGPT模型开源啦!可商用,8个模型

    「AIGC开放社区」为大家介绍了融资1亿美元的生成式AI平台Writer。该企业能在短短3年时间获得1.26亿美元总融资成为ChatGPT的主要竞争对手之一,与其精湛的技术密不可分,同时充分证明其模型有成功的应用案例并获得资本、用户的认可。Palmyra非常值得那些希望将大语言模型实现商业化的开发者们,研究其模型架构和功能借鉴其成功经验。

  • Bing Chat创意和精确模式全面采用GPT-4

    微软搜索主管MikhailParakhin在Twitter上正式宣布,BingChat在创意和精确模式下100%采用GPT-4。这一消息为微软在人工智能领域的发展迈出了重要的一步。市场竞争激烈,微软需要继续努力以实现其市场份额的增长目标。

  • 万卡训练史上最大参数模型!百度文心大模型4.0最快下周见

    日前有媒体报道称,百度正加紧训练文心大模型4.0,已经接近可发布状态,这将是文心大模型3.5版本后,又一个重磅版本。文心大模型4.0进展比预期快很多,将是基础模型的大升级,理解、生成、逻辑、记忆核心能力都将提升,特别是在逻辑推理、代码和数学等方面提升最明显。经过全面升级后,文心大模型4.0的训练速度、推理速度等将进一步提升,能否与GPT-4一战甚至超越后