首页 > 业界 > 关键词  > 正文

通义千问72B模型荣登大模型评测平台OpenCompass榜首

2023-12-13 11:36 · 稿源:站长之家

站长之家(ChinaZ.com)12月13日 消息:中国权威的大型模型评估平台OpenCompass最近更新其排名,通义千问72B模型以67.1的高分荣登榜首。

OpenCompass是由上海人工智能实验室推出的开源大型模型评估平台,其评估范围涵盖学科、语言、知识、理解和推理五个维度,能够全面评估大型模型的能力。

在OpenCompass的中文数据集评测中,Qwen-72B基础大型模型和对话大型模型(Qwen-72B-Chat)分别占据了前两名,显著优于其他模型。

微信截图_20231213113631.png

在12月初,阿里云宣布开源其拥有720亿参数的大型语言模型通义千问Qwen-72B。Qwen-72B在十个权威基准测评中创下了开源模型的最佳成绩,从而成为业界最强大的开源大型模型。其性能超越了开源的标杆模型Llama2-70B以及大部分商业的非开源模型,适合于企业级和科研级的高性能应用。

据了解,通义千问-72B可以处理最长为32k的文本输入,并且在长文本理解测试集LEval上的表现超过了ChatGPT-3.5-16k。

举报

  • 相关推荐
  • AI日报:Kling 2.6将发布;千问APP推学习大模型;Z-Image-Turbo-Fun-Controlnet-Union 开源

    本期AI日报聚焦多领域AI进展:Kling 2.6发布,支持音频同步生成,AI视频进入有声时代;千问APP推出学习大模型,提升拍照答疑与作业批改能力;阿里通义实验室开源图像生成模型,实现精准控制;豆包手机助手遭遇微信登录异常,凸显生态兼容挑战;米哈游推出带猫语特色的AI聊天模型AnuNeko;亚马逊云科技发布三款新型AI智能体,其中Kiro可自主编程数日;IDC报告预测具身智能�

  • AI日报:可灵AI全量上线O1视频大模型;千问APP接入万相Wan2.5

    本文汇总了AI领域的最新动态:可灵AI发布O1视频大模型,支持多模态输入一键生成视频;千问APP接入万相Wan2.5,提升视频创作能力;PixVerse V5.5实现音画同步,简化视频制作;深度求索推出DeepSeek-V3.2,引入稀疏注意力机制降低成本;Runway发布Gen-4.5模型,增强视觉质量;谷歌优化AI搜索体验,Gemini 3 Pro扩展国际市场;Lovart推出Touch Edit功能,实现零门槛图像编辑;蚂蚁数科Agentar入选中国智能体开发赛道第一梯队,展现技术实力。

  • 阿里千问启用全新域名qianwen.com 支持Qwen3系列更多模型 下载量已突破1000万次

    11月24日,阿里旗下AI助手“千问”启用新域名qianwen.com,网页端与App端体验一致,用户可直接体验其强大能力。网页端面向专业用户开放更多Qwen3系列模型选择,并新增代码、深度研究及对话分组功能。千问基于全球性能第一的开源模型Qwen3,免费使用,结合各类生活场景生态,与ChatGPT全面竞争。自11月17日公测以来,千问App下载量一周突破1000万次,增长速度超越ChatGPT、Sora及DeepSeek同期表现,刷新行业纪录,成为史上增长最快的AI应用。

  • 千问登场,阿里瞄准C端关键一战

    2023年9月,在正式接任CEO的第三天,吴泳铭发布的首份阿里全员信,宣布了阿里新的战略重点方向:用户为先、AI驱动。当时行业内更多把它视为一家企业在AI时代的惯性表述。 然而,就在过去一年中,围绕AI在C端用户场景的“可能性”,全球AI行业的叙事逻辑已经发生了明显转向。 OpenAI在完成大模型能力的“基座化”后,开始把更多资源押在C端生态。过去两年,随着GPT-5等产�

  • 千问,阿里的未竟之梦

    在一个大阿里和一个吴妈的统一指挥下,千问诞生了。 11月17日,阿里正式宣布推出“千问”项目,面向公众上线其App公测版。该项目前身为智能信息事业群旗下的“通义App”,改名后的千问号称“阿里最强大模型官方助手”,定位为“会聊天、能办事”的个人AI助手。 官方称,千问后期计划与阿里生态内的各类生活场景深度结合。其目标是与ChatGPT展开全面竞争,标志着阿里

  • Qwen用开源逆袭GPT的故事,千问APP要再干一遍

    Qwen模型逆袭GPT的策略,阿里准备再用一次。 2018年,OpenAI发布了自己的第一个模型GPT1,占据了技术先机,随后变得越来越封闭。在大洋彼岸,阿里几乎同一时间着手大模型研究,到2023年推出“通义千问”时,则选择了一条完全不同的路径:直接开源模型,允许开发者免费使用、改进和集成。 这个策略让Qwen逐步积累起规模,做到了如今全球开发者基于它发布了17万个衍生模型�

  • 最晚出发的千问,为什么还有机会?

    阿里在打开新的AI叙事结构之后,也在寻找新的支点和沸点。 刚刚公布的截至2025年9月30日季度报告,增幅最大的是云智能集团,营收为398.24亿元,同比增长34%。这是阿里AI相关产品收入连续9个季度保持三位数同比增幅。 报告期的季度营收为2477.95亿元,同比增长5%,经营利润同比下降85%,归属母公司净利润209.9亿元,同比下降52%。 阿里解释,下降的主要原因是对即时零售、用

  • 夸克AI眼镜明日发布:首款搭载阿里千问的智能硬件

    阿里千问AI应用推进迅速,已与夸克AI浏览器深度融合,并内置夸克AI眼镜。其APP公测一周下载量破千万,超越ChatGPT等国际应用,成增长最快AI应用。夸克AI眼镜S1搭载双目光机方案,实现低反光、高透视觉效果,配备索尼IMX681传感器、1200万超广角镜头,支持0.6秒抓拍、3K视频。智能化方面支持通话、翻译、备忘等主流功能,集成高德导航、支付宝等,拓展使用场景。

  • 千问爆火、Gemini 3翻身,阿里和谷歌的同题异解

    全球AI To C的市场局势,似乎悄然发生了转变。 以OpenAI、DeepSeek等为代表的AI创业公司,凭借着对大模型技术能力的突破,在AI To C的应用市场中占据着领导者地位。 与之相对的,是原本在移动互联网时代的大厂们,如谷歌、阿里巴巴等,似乎在过去这段时间中,C端的AI应用远未达到预期。 但最近,不管是谷歌,还是阿里,都凭借着AI打了一场漂亮的“翻身仗”。

  • 超越Gemini3、GPT5.1!阿里千问登顶空间推理全球冠军

    今日,空间推理基准测试SpatialBench更新了最新一期榜单,阿里千问的视觉理解模型Qwen3-VL、Qwen2.5-VL位列头两名,超越Gemini 3、GPT-5.1、Claude Sonnet4.5等国际顶尖模型。 SpatialBench榜单显示,Qwen3-VL-235B和Qwen2.5-VL-72B分别斩获13.5和12.9分,领先于Gemini 3.0 Pro Preview(9.6) 、GPT-5.1(7.5)、Claude Sonnet 4.5等海外顶尖模型。

今日大家都在搜的词: