首页 > 业界 > 关键词  > 通义千问最新资讯  > 正文

上线仅7天!阿里通义千问3强势登顶全球开源模型宝座

2025-05-06 16:13 · 稿源: 快科技

快科技5月6日消息,近日,国际权威大模型测评榜LiveBench公布了最新一期排名,阿里巴巴开源的新一代通义千问模型Qwen3(简称千问3”)斩获全球开源模型冠军。

同时,千问3在指令遵循这一关键能力上超越o3 High、o4-Mini High、Gemini 2.5 pro等顶级闭源模型,位列全球第一

据了解,LiveBench榜单由图灵奖得主、Meta首席AI科学家杨立昆联合纽约大学等机构推出,从数学、推理、编程、语言理解等多个复杂维度全面评估大模型。

因其采用动态更新的题库,被誉为全球首个无法作弊的模型基准测试”

此前,通义千问3是阿里巴巴在4月29日凌晨,正式发布开源新一代通义千问模型,其参数量仅为DeepSeek-R1的1/3,成本大幅下降,性能全面超越R1、OpenAI-o1等全球顶尖模型。

据了解,千问3是国内首个混合推理模型”,快思考”与慢思考”集成进同一个模型,对简单需求可低算力秒回”答案,对复杂问题可多步骤深度思考”,大大节省算力消耗。

值得一提的是,性能大幅提升的同时,千问3的部署成本还大幅下降,仅需4张H20即可部署千问3满血版,显存占用仅为性能相近模型的三分之一。

举报

  • 相关推荐
  • 阿里发布首个具身大模型Qwen-Robot系列:三个模型支持协同运转

    近日阿里巴巴正式发布千问具身智能大模型Qwen-Robot系列,涵盖VLA操作模型Qwen-RobotManip、VLN移动模型Qwen-RobotNav与世界模型Qwen-RobotWorld三大核心模型。 这是千问大模型家族首个完整的具身智能模型矩阵三个模型分别为机器人赋予操作能力、导航能力和环境认知能力,既可独立部署,亦可协同运转,为各类形态的机器人走向真实场景提供了统一的通用底座”。 当前,全球具身智�

  • 超节点提效30%!华为官宣昇腾亲和大模型:6月30日开源上线

    华为开发者大会(HDC 2026)上,华为常务董事、终端BG董事长余承东在大会主题演讲中宣布,推出昇腾亲和大模型,覆盖算法架构到训练推理全流程。 昇腾亲和大模型是业界首个DSA SWA独立分层混合架构。针对MoE(混合专家)模型专家路由问题进行了专项优化。 昇腾原生训练实现双重性能提升,训练效率提升30%,512K长序列训练吞吐提升50%

  • 大模型调用成本暴跌90%,盘活数据成为企业AI落地胜负手

    本月DeepSeek V4Pro开启永久降价,价格仅为原来的四分之一,缓存命中低至0.025元每百万token,引发行业“跳水式降价”。随着模型效率提升、算力成本优化和市场竞争加剧,大模型调用成本全面下行已成共识。国内公有云大模型API均价较2023年已下跌超90%,性能提升3至5倍。AI普惠时代来临,企业接入门槛快速抹平,但决定AI落地效果的核心变量转向企业自身的数据根基。数据准确性、治理规范、权限管理及智能体对核心数据的安全高效访问,直接影响AI应用效果。Gartner研究显示,85%的失败AI项目源于数据质量缺陷。数据底座正成为企业业务效率与决策方式的关键基础设施,逻辑数据管理路径被越来越多企业验证:在分布式环境上构建可信、实时、可治理的逻辑数据层,让智能体在不触碰数据物理位置的情况下安全、准确、实时获取所需,将AI能力真正嵌入业务流程。Agent时代,模型是入场券,数据才是护城河。

  • AI日报:阿里上线首个官方大模型NBA Chat; Ideogram4.0开源发布;OpenAI升级ChatGPT记忆系统

    今日AI领域动态:Ideogram 4.0开源发布,93亿参数打造最强文字生成AI,提升海报与品牌营销创作;OpenAI升级ChatGPT记忆系统,算力降至1/5,解决过时与准确性痛点;腾讯文档推出行业首创“人机双写”原生编辑器;xAI发布Grok Imagine Video 1.5,支持图片转视频;豆包回应AI识别野生蘑菇误判,强调仅供参考;知乎Q1扭亏为盈,AI短剧成增长点;腾讯云ADP 4.0新增Claw模式,提升企业Agent构建效率;NBA中国与阿里推出首个官方大模型“NBA Chat”。

  • 格尔AI大模型安全保险箱荣膺第十二届上交会“镇馆之宝”

    近日,第十二届中国(上海)国际技术进出口交易会上,格尔软件自主研发的“格尔AI大模型安全保险箱”荣获最高荣誉“镇馆之宝”,成为上交会史上首家获此殊荣的民营科技企业。该产品针对大模型应用中的知识产权泄露、数据外泄等痛点,通过加密、权控、可信三大机制构建安全闭环,实现内核级防护,支持主流大模型及框架,兼容国产系统与架构,已通过权威评估,并落地于大模型厂商、政企用户及算力平台三大场景,标志着业界对“密码+AI安全”路线的高度认可。

  • 科技照进现实 鸿蒙原生首个3D大模型AI应用V2Fun正式发布

    6月13日,华为HDC2026大会上,Vertex Lab旗下V2Fun鸿蒙原生App正式亮相并上线应用市场。作为鸿蒙首个3D大模型AI原生应用,V2Fun通过自研大模型,实现从2D照片到3D模型的极简转化,用户仅需拍照或上传图片,数十秒即可生成高精度3D模型,支持360°预览、3D打印格式导出及四种风格化图片生成。App深度集成华为图库、近场分享及跨设备3D打印互联,配合Web端专业管线,实现“移动端起草、专业端深化”的无缝衔接,让3D创作人人可用。

  • 机器人伴侣仅限成人购买使用:内置养成系专属情感大模型

    上线仅10天,主打情感陪伴的人形机器人U1为优必选收获了超过3800台预售订单,对应定金总额逾千万元。对于去年仅售出1079台人形机器人的优必选而言,这次尝试已算小有突破”。 U1系列分男女两款机型:男款身高183厘米、重42公斤;女款身高168厘米、重35.2公斤。 两款均支持Wi-Fi连接,单次充电续航2至4小时,无3C”认证,配备88个高自由度运动关节,搭载养成系”情感大模型

  • 最强AI大模型Fable 5、Mythos 5发布:人类智力优势还能撑多久

    Anthropic发布基于Mythos Preview的Claude Fable 5和Mythos 5两款AI模型,自称最强,在多项测试中达SOTA水平。Fable 5面向公众开放,保留安全运制;Mythos 5无运制但仅限审核机构使用。两者性能卓越,尤其在编程方面提升明显,但存在定价昂贵(1M输入/输出分别需10/50美元)、安全运制敏感(触发即降级至Opus 4.8)及强制30天安全审计等问题,影响商业用户使用。

  • 卓世科技入选“2026 AI科技小巨人TOP50”,以行业大模型与具身智能大脑构筑AI产业新底座

    近日,互联网周刊与德本咨询联合发布“2026AI科技小巨人TOP50”榜单,卓世科技(海南)凭借行业大模型研发、具身智能通用大脑搭建及全栈智能体执行引擎等硬核实力成功登榜。公司坚持“AI普惠”理念,打造“璇玑玉衡”千亿参数大模型体系,并首创Tri-Core三核协同具身智能通用大脑架构,破解行业痛点。同时推出NextClaw(龙虾)全栈执行引擎及OPC数字员工,实现从云端认知到物理世界执行的全链路打通,推动AI从“虚拟智能”向“物理AI”跨越。

  • AI日报:千问全面开放第三方Agent与Skill;字节开源统一框架 Bernini;OpenAI 推出 Sites 功能

    AI日报今日要点:1. 阿里千问全面开放第三方Agent与Skill,瑞幸、东航等首批接入,升级为"超级Agent"个人助手;2. 字节跳动开源Bernini框架,通过"先理解、再生成"机制解决视频编辑画面失控问题;3. OpenAI推出Sites功能,可将创意秒变互动网站;4. 微软Win11隐藏AI卸载选项,可释放超2.5GB硬盘空间;5. DeepSeek首轮融资估值或达4000亿元,腾讯、宁德时代拟参投;6. OpenAI发布六行业Codex工作流插件;7. 谷歌推出Android虚假来电检测功能;8. 亚马逊Ring门铃人脸识别功能遭集体诉讼。

今日大家都在搜的词: