首页 > 业界 > 关键词  > 正文

阿里云通义千问140亿参数模型14B正式开源:十二测评全方位超越同规模SOTA大模型

2023-09-25 19:09 · 稿源: 快科技

快科技9月25日消息,阿里云通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat正式开源,免费可商用。

据了解,Qwen-14B在多个权威评测中超越同等规模模型,部分指标甚至接近Llama2-70B。

Qwen-14B是一款支持多种语言的高性能开源模型,相比同类模型使用了更多的高质量数据,整体训练数据超过3万亿Token,使得模型具备更强大的推理、认知、规划和记忆能力。Qwen-14B最大支持8k的上下文窗口长度。

阿里云通义千问140亿参数模型14B正式开源:十二测评全方位超越同规模SOTA大模型 Qwen-14B在十二个权威测评中全方位超越同规模SOTA大模型

Qwen-14B-Chat是在基座模型上经过精细SFT得到的对话模型。借助基座模型强大性能,Qwen-14B-Chat生成内容的准确度大幅提升,也更符合人类偏好,内容创作上的想象力和丰富度也有显著扩展。

Qwen拥有出色的工具调用能力,能让开发者更快地构建基于Qwen的Agent(智能体)。开发者可用简单指令教会Qwen使用复杂工具,比如使用Code Interpreter工具执行Python代码以进行复杂的数学计算、数据分析、图表绘制等;还能开发具有多文档问答、长文写作等能力的高级数字助理”。

百亿以内参数级别大语言模型是目前开发者进行应用开发和迭代的主流选择,Qwen-14B进一步提高了小尺寸模型的性能上限,从众多同尺寸模型中冲出重围,在MMLU、C-Eval、GSM8K、MATH、GaoKao-Bench等12个权威测评中取得最优成绩,超越所有测评中的SOTA(State-Of-The-Art)大模型也全面超越Llama-2-13B,比起Llama 2的34B、70B模型也并不逊色。

与此同时,Qwen-7B也全新升级,核心指标最高提升22.5%。

阿里云通义千问140亿参数模型14B正式开源:十二测评全方位超越同规模SOTA大模型 Qwen-14B性能超越同尺寸模型

用户可从魔搭社区直接下载模型,也可通过阿里云灵积平台访问和调用Qwen-14B和Qwen-14B-Chat。阿里云为用户提供包括模型训练、推理、部署、精调等在内的全方位服务。

8月,阿里云开源通义千问70亿参数基座模型Qwen-7B,先后冲上HuggingFace、Github的trending榜单。短短一个多月,累计下载量突破100万。开源社区出现了50多个基于Qwen的模型,社区多个知名的工具和框架都集成了Qwen。

阿里云通义千问140亿参数模型14B正式开源:十二测评全方位超越同规模SOTA大模型

通义千问是落地最深、应用最广的中国大模型,国内已有多个月活过亿的应用接入通义千问,大量中小企业、科研机构和个人开发者都在基于通义千问开发专属大模型或应用产品,如阿里系的淘宝、钉钉、未来精灵,以及外部的科研机构、创业企业。

浙江大学联合高等教育出版社基于Qwen-7B开发了智海-三乐教育垂直大模型,已在全国12所高校应用,可提供智能问答、试题生成、学习导航、教学评估等能力,模型已在阿里云灵积平台对外提供服务,一行代码即可调用;浙江有鹿机器人科技有限公司在路面清洁机器人中集成了Qwen-7B,使机器人能以自然语言与用户进行实时交互,理解用户提出的需求,将用户的高层指令进行分析和拆解,做高层的逻辑分析和任务规划,完成清洁任务。

阿里云CTO周靖人表示,阿里云将持续拥抱开源开放,推动中国大模型生态建设。阿里云笃信开源开放的力量,率先开源自研大模型,希望让大模型技术更快触达中小企业和个人开发者。

阿里云还牵头建设了中国最大的AI模型开源社区魔搭ModelScope,团结全行业的力量,共同推动大模型技术普惠和应用落地。过去两个月内,魔搭社区的模型下载量从4500万飙升到8500万,增幅接近100%。

举报

  • 相关推荐
  • AI日报:AI内容新规正式生效;美团推出开源大模型LongCat;阶跃发布语音大模型Step-Audio 2 mini

    AI日报栏目每日更新AI领域热点内容,聚焦开发者需求。本期重点包括:阶跃星辰发布端到端语音大模型Step-Audio2 mini,在多项基准测试中表现优异;9月1日起AI生成内容需强制标识;美团推出开源大模型LongCat;上海AI实验室发布多模态大模型InternVL3.5;腾讯ARC团队推出音频生成模型AudioStory;OpenAI发布实时语音模型GPT-realtime;Meta与UCSD合作推出DeepConf技术;xAI代码库遭窃事件;阿里巴巴Qwen团队发布GUI自动化框架;微软推出Copilot Labs实验中心;小红书自动化工具xiaohongshu-mcp上线。

  • 日月健「太极」智能戒指归来,全方位健康管理的进阶之作

    随着可穿戴设备行业的发展,智能戒指逐渐走向大众视野。DR+H日月健于2023年初推出“太极”智能戒指,由香港设计师陈幼坚设计,融合东方太极阴阳美学与现代科技。产品不仅关注运动与健康数据监测,还新增情绪感知与压力管理功能,搭载27种身心状态感知引擎,提供全天候生理细节追踪。结合NFC无线充电与IP68防水防尘,提升使用体验。品牌通过“TAIJI GIRL”IP提供专业健康咨询,致力于科技与生活的和谐共生。

  • 让天下没有难查的故障:2025 阿里云 AI 原生编程挑战赛正式启动

    阿里云主办的2025 AI原生编程挑战赛聚焦智能运维(AIOps)赛道,旨在通过AI技术解决云原生环境下的系统故障定位问题。比赛提供真实云原生环境及多模态可观测数据,鼓励开发者借助大语言模型(LLM)打造低成本、高效率的故障诊断智能体。冠军可获得3万元奖金,并有机会与行业专家交流。赛事致力于推动AI在运维领域的创新应用,提升系统稳定性与可用性。

  • 企业品牌GEO推广:在哪里做最有效?全方位平台选择指南

    随着AI技术普及,传统搜索引擎优化正向生成引擎优化(GEO)转型。用户依赖AI工具获取信息,企业品牌推广面临新机遇与挑战。需选择合适的GEO平台与策略,如ChatGPT、Claude、Google Bard/Gemini等主流平台,以及国内百度文心一言、阿里通义千问等。企业应优化内容,确保品牌信息准确展示,并关注多模态AI、个性化推荐等趋势。GEO推广需长期投入和持续优化,与专业机构合作可提升效率。

  • AI日报:腾讯开源3D世界模型HunyuanWorld-Voyager;即梦AI系列模型开放API;通义推智能体开发框架AgentScope 1.0

    本文介绍了AI日报栏目,聚焦人工智能领域最新动态。主要内容包括:腾讯开源具备3D重建能力的HunyuanWorld-Voyager模型、通义实验室推出的多智能体开发框架AgentScope 1.0、即梦AI开放图像与视频生成API、腾讯翻译模型Hunyuan-MT-7B在WMT2025斩获佳绩、苹果推出图像生成技术STARFlow和视觉语言模型FastVLM、新模型CoMPaSS-FLUX.1提升空间理解能力、Cherry Studio免费提供Qwen38B模型、谷歌Gemini API新增网页内容解析功能,以及腾讯优图开源智能体框架Youtu-Agent。这些进展展现了AI技术在多个领域的创新与应用。

  • 从1920TPS到2400TPS,华为云Tokens服务全面接入384超节点

    华为云在2025年8月27日宣布其Tokens服务全面接入CloudMatrix384超节点,通过xDeepServe架构创新,实现单芯片最高2400TPS吞吐量和50ms低延迟,性能超越业界水平。该服务基于MaaS模式,提供多种规格选择,支持大模型和AI工具,助力企业快速开发AI应用。同时,华为云与超100家伙伴合作,深入行业场景,共建智能生态,加速各行业AI落地。

  • 如何精准计算AI大模型调用成本?复杂参数太多,预算总超支怎么办?

    文章探讨了AI模型调用成本管理的痛点,包括GPT-4等模型复杂的计费规则(如Token分级、上下文溢价、多模态叠加收费)导致实际成本常超预算40%。提出AIbase计算器三步解决方案:自动匹配场景参数、实时联动报价、明细成本拆解。通过跨境电商客服和高校实验室案例验证工具有效性,强调数据溯源、用量预警和预算缓冲功能,帮助开发者实现精准成本控制,告别手动制表与定�

  • 百度APP发布AI星河计划,构建AIGC创作者全方位扶持体系

    8月29日,百度AIGC未来创作联赛颁奖典礼在京举行,活动汇聚众多高质量AIGC作品与优秀创作者。百度发布“AI星河计划”,投入亿级流量和千万现金补贴,通过流量扶持、涨粉加速、分成翻倍、多元变现等手段,构建全方位创作者专属成长扶持体系。该计划根据作者AI技术与内容创作能力区分4档创作者,提供定制化支持套餐,最高可享亿级流量池和3倍分成补贴。百度APP依托月活7.35亿流量池与技术优势,已成为AIGC内容平台市场头部玩家,期待与更多优秀创作者共建未来内容生态。

  • OpenAI的开源模型现已在IBM watsonx.ai上提供

    OpenAI发布两款开源AI模型GPT-OSS-120B和GPT-OSS-20B,允许开发者自由下载、运行和定制。其中120B模型已部署在IBM Watsonx.ai平台,采用专家混合架构,支持本地或云端部署,不受商业用途限制。模型具备高透明度,输出完整推理链,在多项基准测试中表现优异。此次发布标志着OpenAI首次加入开源生态,IBM强调其开放战略,为企业提供灵活、安全的AI开发选择。

  • 容联云「大模型金融质检」重磅升级:懂业务、全场景、高精度

    金融强监管下,质检是运营关键但效率低。传统人工质检覆盖不足5%,成本高且漏检率高。容联云推出大模型质检方案,实现100%全量覆盖,准确率达96%,成本降40%。覆盖客服、营销、合同、反欺诈四大场景,将风险从被动补救转向主动预防,助力企业实现精准、高效、可溯源的智能合规管理。

今日大家都在搜的词: