阿里云发布通义千问2.5版性能赶超GPT-4 Turbo

2024-05-09 11:01 · 稿源：站长之家

站长之家（ChinaZ.com）5月9日消息:阿里云今日正式发布通义千问2.5版本，该版本在模型性能上全面赶超了GPT-4Turbo，展现了其强大的技术实力。与此同时，通义千问最新开源的1100亿参数模型Qwen1.5-110B在多个基准测评中取得了卓越成绩，超越了Meta的Llama-3-70B模型，成为开源领域的新星。

与通义千问2.1版本相比，2.5版本在理解能力、逻辑推理、指令遵循和代码能力等方面均有了显著提升。具体而言，理解能力提升了9%，逻辑推理能力提升了16%，指令遵循能力提升了19%，而代码能力则提升了10%。这一飞跃性的进步使得通义千问2.5在权威基准OpenCompass上的得分与GPT-4Turbo持平，证明了其在自然语言处理领域的领先地位。

阿里云、通义千问

除了通义千问2.5的发布，通义还推出了最新款开源模型Qwen1.5-110B。这款拥有1100亿参数的模型在MMLU、TheoremQA、GPQA等基准测评中均表现出色，成功超越了Meta的Llama-3-70B模型。在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上，Qwen1.5-110B更是荣登榜首，进一步巩固了通义开源系列在业界的领先地位。

通义的多模态模型和专有能力模型同样令人瞩目。其中，通义千问视觉理解模型Qwen-VL-Max在多个多模态标准测试中超越了Gemini Ultra和GPT-4V，其强大的视觉理解能力已经在实际应用中得到了广泛验证。而通义千问代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的头名选手，展现了其在代码生成和代码理解方面的卓越能力。

这一模型的推出不仅满足了开发者对于高效代码生成的需求，也为企业客户提供了更为智能的代码管理和优化解决方案。

（举报）

相关推荐

关键词：

荐AI日报：生数科技推出Vidu Q2；火山引擎推出炉米Lumi；通义千问开源300+模型

本文汇总了近期AI领域多项重要进展：生数科技推出Vidu Q2模型，显著提升视频生成中细微表情的真实感；火山引擎发布炉米Lumi平台，支持视觉模型LoRA微调以定制独特风格；阿里云通义千问开源超300个模型，下载量突破6亿次；百度开源多模态视觉理解模型Qianfan-VL，适配不同场景需求；微软在Copilot中引入Anthropic模型，拓展AI助手功能；OpenAI计划在美国新建五个数据中心以加速Stargate项目；英伟达开源Audio2Face模型，提升实时面部动画生成效果；Meta发布具备沙箱推演能力的32B代码世界模型CWM，优化代码调试效率。这些动态展示了AI技术在视觉、多模态、开源生态及硬件支持等方面的快速迭代与创新突破。

AI 视频生成细微表情
海尔智家联手1100多家上下游供应商绿色转型

在双碳目标和可持续发展背景下，海尔智家通过供应链绿色转型推动制造业高质量发展。2025年全球ESG峰会展示其覆盖产品全生命周期的绿色产业链实践，重点包括对1100多家供应商进行社会责任审核与碳管理能力评估，将ESG表现纳入合作核心标准。通过引入数字化平台提升供应链管理效能，构建互利共赢的绿色生态，不仅履行龙头企业责任，更增强了供应链韧性，为行业可持续发展提供了有效范式。

双碳目标可持续发展产业链绿色转型
模型即服务，应用即未来：阿里云助力中小企业AI应用规模化落地

阿里云针对中小企业AI落地“不会用、用不起、用不好”痛点，提出全链路解决方案。数据显示，77%全球中小企业已定期使用AI工具，中国市场需求增长强劲。阿里云通过通义大模型技术迭代、AIStack一体化底座及4R服务框架，降低使用门槛与成本。典型案例如万小智AI员工实现“分钟级交付”，博登智能提升数据处理效率7倍。方案覆盖制造、医疗等12大行业，助力企业从“有算力”到“能落地”，推动AI应用成为行业常态。

中小企业AI落地 AI解决方案 AI应用实践
荐AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠榜Hugging Face；Veo3视觉能力升级

蚂蚁百灵团队开源高性能思考模型Ring-flash-2.0，在多项基准测试中表现优异；阿里通义7款模型登顶Hugging Face榜单，Qwen3-Omni凭借多模态能力全球第一。谷歌Veo3突破视频生成局限，可自动完成视觉任务；特斯拉推进人形机器人量产，马斯克称其为最重要产品。马斯克第六次起诉OpenAI窃取商业机密，苹果内部测试聊天机器人Veritas优化Siri，YouTube推出AI音乐主播增强互动，LiquidAI发布轻量级模型Liquid Nanos优化边缘计算。

AI 开源模型高性能思考模型
荐没想到，音频大模型开源最彻底的，居然是小红书

不难发现，近几个月，开源频频成为 AI 社区热议的焦点。尤其是对于国内科技公司来说，开源成为主旋律。根据 Hugging Face 中文 AI 模型与资源社区的数据显示，国内厂商在七八月接连开源33款、31款各类型大模型。这些开源成果大多落在了文本、图像、视频、推理、智能体以及世界模型领域，而音频生成占比很小。

开源 AI社区音频生成
AI落地难？阿里云AI先锋新成员实战证明，对症的场景化方案才是关键

本文探讨AI技术如何通过精准定位与协同合作破解行业难题。文章指出，AI渗透速度远超传统技术，IDC预测2025年全球AI支出将达3370亿美元。以阿里云为例，其通过算力底座与通用技术链接垂直领域伙伴，提供"技术+场景"一体化方案。文中列举挖地兔、集思科技等6家企业案例，展示AI在量化投资、电商直播等场景的实际应用，强调AI落地需找准对应场景，而阿里云的技术支撑与生态协同正推动千行百业实现数字化转型。

AI渗透技术支出应用落地
荐挑战做100个“猫”房子，90后小鲁班如何获赞2000万？

当代鲁班下凡，只为一只猫! “楚喵的世界”上线即封神!@爱鼓捣的邢志磊成为抖音精选新的爆款制造机。其中，《猫咪的地铁站》一条视频就能达到975万点赞、44万评论，直接把“人不如猫”卷成2025最离谱共识。当牛马打工人还在给猫主子们买9块9包邮的纸箱，这位山东爸爸已经手搓地铁、别墅、电影院，直接把喵星人送进喵生巅峰! 在短视频爆火的快时代，他的慢内容�

文章搜索核心标签内容分析
Testin 云测入选 “2025 新科技 100 强金 i 奖”，AI测试技术成核心壁垒

9月19日，Testin云测凭借AI测试技术入选“2025新科技100强金i奖”，获评“AI测试领航服务商”。其推出的Testin XAgent系统通过自然语言处理、视觉识别与自主探索能力，实现测试用例自动生成与全流程覆盖，推动软件测试从自动化向智能化升级。同时，Testin积极参与行业标准制定，联合信通院启动智能测试能力评估体系，助力构建规范化行业生态。目前，Testin已服务超300万款应用，未来将持续以AI为核心引擎，重塑软件研发质量效能，彰显中国技术在AI测试领域的领先实力。

AI测试荣誉加身数智化转型
考拉悠然开源悠然无界大模型BLM-1.0，以空间智能引擎驱动产业变革

9月28日，在成都举行的“2025天府人工智能产业生态大会”上，考拉悠然宣布其自主研发的“悠然无界大模型BLM-1.0”完成迭代升级并全面开源，同时发布基于该模型的UU Holo Glass O1 AR工业眼镜。此举标志着公司以“技术开源+场景落地”双轮驱动策略，推动空间智能产业生态共建。BLM-1.0突破传统模型局限，具备跨空间、跨任务、跨本体的“三跨”统一能力，在空间理解、推理与执行三大核心能力上刷新行业纪录。配套AR眼镜深度融合空间感知与多模态交互，实现工业运维、安装巡检等场景的全程自动化与智能辅助，显著提升效率并降低成本。

人工智能开源大模型空间智能
全球首个！OpenAI将推“AI版抖音”：禁止上传实拍内容视频100%由AI生成

国庆假期前夕，OpenAI发布了Sora 2，一款旗舰视频和音频生成模型。据介绍，Sora 2可以完成以前的视频生成模型难以完成的事情，比如运动员的奥林匹克体动作、桨板上的后空翻，准确模拟浮力和刚度的动态等等，并擅长现实主义、电影和动漫风格。一则来自《连线》杂志的重磅爆料更是指出，OpenAI的下一步棋，并非简单升级一个模型，而是要亲自下场，推出一个独立的AI影�

OpenAI Sora 2

今日大家都在搜的词：

热文

3 天
7天

阿里云发布通义千问2.5版性能赶超GPT-4 Turbo

荐AI日报：生数科技推出Vidu Q2；火山引擎推出炉米Lumi；通义千问开源300+模型

海尔智家联手1100多家上下游供应商绿色转型

模型即服务，应用即未来：阿里云助力中小企业AI应用规模化落地

荐AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠榜Hugging Face；Veo3视觉能力升级

荐没想到，音频大模型开源最彻底的，居然是小红书

AI落地难？阿里云AI先锋新成员实战证明，对症的场景化方案才是关键

荐挑战做100个“猫”房子，90后小鲁班如何获赞2000万？

Testin 云测入选 “2025 新科技 100 强金 i 奖”，AI测试技术成核心壁垒

考拉悠然开源悠然无界大模型BLM-1.0，以空间智能引擎驱动产业变革

全球首个！OpenAI将推“AI版抖音”：禁止上传实拍内容视频100%由AI生成

今日大家都在搜的词：

热文

雷军：小米17系列开售仅5天销量破100万台

微信又更新了撤回消息有大变化：可撤回本次发送的全部消息

雷军：小米17系列首销权益延续至10月31日

理想汽车推出焕新版L系限时优惠 10 月 8 日前享1.5万置换补贴

比特币价格突破12.5万美元刷新历史最高纪录

小米回应“小米汽车突然自己开走”：排除车辆质量问题

小米17 1TB版明日开售售价5299元

雷军：小米17系列开售仅5天销量破100万台

乔布斯逝世14周年库克发文缅怀：我们深切怀念你

腾讯混元图像3.0登顶LMArena榜一

小米 17 标准版1TB版本 5299 元开售全系列销量同比增超20%

微信又更新了撤回消息有大变化：可撤回本次发送的全部消息

雷军：小米17系列首销权益延续至10月31日

站长商机

阿里云发布通义千问2.5版 性能赶超GPT-4 Turbo

今日大家都在搜的词：

热文

站长商机

阿里云发布通义千问2.5版性能赶超GPT-4 Turbo