首页 > 业界 > 关键词  > 正文

阿里云通义千问140亿参数模型14B正式开源:十二测评全方位超越同规模SOTA大模型

2023-09-25 19:09 · 稿源: 快科技

快科技9月25日消息,阿里云通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat正式开源,免费可商用。

据了解,Qwen-14B在多个权威评测中超越同等规模模型,部分指标甚至接近Llama2-70B。

Qwen-14B是一款支持多种语言的高性能开源模型,相比同类模型使用了更多的高质量数据,整体训练数据超过3万亿Token,使得模型具备更强大的推理、认知、规划和记忆能力。Qwen-14B最大支持8k的上下文窗口长度。

阿里云通义千问140亿参数模型14B正式开源:十二测评全方位超越同规模SOTA大模型 Qwen-14B在十二个权威测评中全方位超越同规模SOTA大模型

Qwen-14B-Chat是在基座模型上经过精细SFT得到的对话模型。借助基座模型强大性能,Qwen-14B-Chat生成内容的准确度大幅提升,也更符合人类偏好,内容创作上的想象力和丰富度也有显著扩展。

Qwen拥有出色的工具调用能力,能让开发者更快地构建基于Qwen的Agent(智能体)。开发者可用简单指令教会Qwen使用复杂工具,比如使用Code Interpreter工具执行Python代码以进行复杂的数学计算、数据分析、图表绘制等;还能开发具有多文档问答、长文写作等能力的高级数字助理”。

百亿以内参数级别大语言模型是目前开发者进行应用开发和迭代的主流选择,Qwen-14B进一步提高了小尺寸模型的性能上限,从众多同尺寸模型中冲出重围,在MMLU、C-Eval、GSM8K、MATH、GaoKao-Bench等12个权威测评中取得最优成绩,超越所有测评中的SOTA(State-Of-The-Art)大模型也全面超越Llama-2-13B,比起Llama 2的34B、70B模型也并不逊色。

与此同时,Qwen-7B也全新升级,核心指标最高提升22.5%。

阿里云通义千问140亿参数模型14B正式开源:十二测评全方位超越同规模SOTA大模型 Qwen-14B性能超越同尺寸模型

用户可从魔搭社区直接下载模型,也可通过阿里云灵积平台访问和调用Qwen-14B和Qwen-14B-Chat。阿里云为用户提供包括模型训练、推理、部署、精调等在内的全方位服务。

8月,阿里云开源通义千问70亿参数基座模型Qwen-7B,先后冲上HuggingFace、Github的trending榜单。短短一个多月,累计下载量突破100万。开源社区出现了50多个基于Qwen的模型,社区多个知名的工具和框架都集成了Qwen。

阿里云通义千问140亿参数模型14B正式开源:十二测评全方位超越同规模SOTA大模型

通义千问是落地最深、应用最广的中国大模型,国内已有多个月活过亿的应用接入通义千问,大量中小企业、科研机构和个人开发者都在基于通义千问开发专属大模型或应用产品,如阿里系的淘宝、钉钉、未来精灵,以及外部的科研机构、创业企业。

浙江大学联合高等教育出版社基于Qwen-7B开发了智海-三乐教育垂直大模型,已在全国12所高校应用,可提供智能问答、试题生成、学习导航、教学评估等能力,模型已在阿里云灵积平台对外提供服务,一行代码即可调用;浙江有鹿机器人科技有限公司在路面清洁机器人中集成了Qwen-7B,使机器人能以自然语言与用户进行实时交互,理解用户提出的需求,将用户的高层指令进行分析和拆解,做高层的逻辑分析和任务规划,完成清洁任务。

阿里云CTO周靖人表示,阿里云将持续拥抱开源开放,推动中国大模型生态建设。阿里云笃信开源开放的力量,率先开源自研大模型,希望让大模型技术更快触达中小企业和个人开发者。

阿里云还牵头建设了中国最大的AI模型开源社区魔搭ModelScope,团结全行业的力量,共同推动大模型技术普惠和应用落地。过去两个月内,魔搭社区的模型下载量从4500万飙升到8500万,增幅接近100%。

举报

  • 相关推荐
  • 国内大模型GEO优化全攻略:免费工具教你监测品牌在文心一言、通义千问等AI平台的可见度

    AI搜索时代,品牌若未出现在AI回答中就等于"不存在"。GEO(生成引擎优化)成为新战场,核心是让AI在回答用户问题时优先引用企业内容。文章详解国内主流AI模型特点:文心一言整合百度生态、通义千问依托阿里电商数据、小众模型在垂直领域更易被引用。提出三大优化策略:内容结构化呈现、建立行业权威背书、布局高权重平台。推荐使用AIBase免费工具实时监测品牌在各大AI平台的曝光情况,通过数据驱动优化策略。

  • GEO排名查询工具怎么用?手把手教你监测品牌在通义千问、Kimi等AI平台的推荐情况

    AI时代催生GEO(生成引擎优化)新范式,正逐步取代传统SEO。GEO关注品牌在AI问答中的提及率、推荐频次与排名,通过优化内容结构提升AI引擎推荐权重。AIBase平台推出专业GEO监测工具,支持五大主流AI平台实时检测,提供竞品对比与优化建议,帮助企业量化品牌在AI生态中的可见度,已成为数字资产评估新标准。

  • 易鑫正式发布汽车金融行业首个Agentic大模型

    易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿,响应延迟低于200毫秒,支持语音实时交互,单卡吞吐达370 tokens/秒,可提升获客、风控与运营效率,解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台,研发投入超20亿元,率先实现AI全场景应用,将持续推动智能汽车金融生态建设。

  • 机器人“全能导航大脑”来了!银河通用发布NavFoM大模型

    银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM,实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用,通过统一“视频流+文本指令→动作轨迹”范式,融合800万条跨任务导航数据,在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施,为规模化商业落地奠定关键基础。

  • 00后担大梁交大本科生在计算机安全顶级会议上实现突破,打造大模型全方位安全分析底座

    上海交大本科生徐菲悦为第一作者的论文《大型语言模型鲁棒性与对齐的多维评估框架》被IEEE S&P 2026录用。该研究提出“安全魔方”评估体系,构建覆盖攻击、防御与判定三大维度的多指标框架,系统化刻画LLM安全性,新增攻击稳定性、跨模型迁移性等关键度量,弥补传统单一指标不足,为研究比较、安全基线制定及监管审查提供可操作的通用量表。

  • 聚焦人像创作核心需求:五款微单逐机拆解,佳能 R50V 全方位领先

    本文针对5000-8000元价位微单相机,聚焦人像拍摄需求,推荐五款热门机型。佳能R50V凭借肤色还原精准、全场景追焦、画质纯净及轻量化设计成为首选,尤其适合直出需求用户。其他机型各具特色:富士X-T30 II主打胶片模拟文艺风,尼康Z50 II侧重多场景均衡,松下G100D适合日常Vlog记录,富士X-T50则以高像素见长。文章建议根据创作场景(静态人像/视频双修/文艺风格)针对性选择,并指出R50V在综合性能上最具竞争力。

  • 红米REDMI K90全方位提升 雷军:是不是越来越有旗舰气质

    Redmi K90作为史上最强标准版手机正式发布,起售价2599元。该机首次采用6.59英寸黄金中尺寸屏幕,兼顾握持手感与视觉体验。背部采用与iPhone17同款一体冷雕工艺,大幅提升质感。搭载骁龙8至尊版芯片、后置5000万AI三摄系统(首次加入2.5X长焦),配备7100mAh电池与100W快充,支持IP68/69防水及经Bose调音的双扬声器。雷军评价其设计工艺彰显旗舰气质,引发市场广泛关注。

  • 小鹏将推出3款全球化Robotaxi 2026年同步开启试运营

    小鹏汽车在2025科技日宣布,将于2026年推出三款全栈自研L4级Robotaxi,同步开启试运营。该车型搭载4颗图灵AI芯片,算力达3000TOPS,配备第二代VLA模型,具备强大泛化学习能力,能自适应全球不同交通习惯。作为中国首款全栈自研Robotaxi,无需额外改装,不依赖高精地图即可实现量产。车辆提供两套智驾方案,分别侧重通勤效率与极致安全,并在六大关键系统采用双冗余设计,确保行驶安全。小鹏还将开放Robotaxi SDK,与高德地图等伙伴共建全球服务生态。

  • 登榜LMArena!文心大模型5.0-Preview文本能力国内第一

    11月8日,文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出,超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容;复杂长问题理解适用于学术问答、报告分析等任务;指令遵循能力支持智能助理、代码生成等场景,为多领域内容生产提供高效支撑。

  • 全球开源技术峰会GOTC 2025 圆满落幕

    11月2日,为期两天的全球开源技术峰会GOT C2025在北京圆满落幕。本届峰会聚焦开源与人工智能深度融合,汇聚全球顶尖专家、行业领袖与数千开发者,共同探讨开源驱动的AI未来蓝图。现场吸引超3000人次参与,线上直播观看量突破500万,全网曝光超6亿次。大会设立十二大专题论坛,覆盖大模型应用、AI编程、云原生AI等前沿领域,并发布Open AgentKit等关键项目。通过“论坛+市集�

今日大家都在搜的词: