首页 > 业界 > 关键词  > 空间推理最新资讯  > 正文

超越Gemini3、GPT5.1!阿里千问登顶空间推理全球冠军

2025-11-26 15:11 · 稿源: 快科技

11月26日,国际空间推理基准测试平台SpatialBench发布最新评测结果。阿里巴巴集团研发的视觉理解模型Qwen系列在本次测评中表现突出,其中Qwen3-VL-235B与Qwen2.5-VL-72B两款模型分别以13.5分和12.9分的成绩位列榜单前两位。

测评数据显示,这两款模型的得分已超越多家国际科技企业推出的同类产品,包括Gemini 3.0 Pro Preview(9.6分)与GPT-5.1(7.5分)等知名模型。

阿里视觉理解模型在空间推理测试中取得领先

值得注意的是,当前技术水平与人类的空间推理能力仍存在明显差距。专业评估显示,人类在处理电路分析、CAD工程及分子生物学等复杂空间推理任务时,基准得分可达80分左右,现有技术尚无法完全替代人类完成这类专业性工作。

据了解,Qwen2.5-VL于2024年对外开放源代码,而Qwen3-VL作为其升级版本,于今年正式发布。新一代模型在视觉感知与多模态推理方面取得显著进展,在32项核心能力评估中表现优异。

该模型具备较强的实用功能,不仅能通过图像完成推理任务,还可基于设计草图或游戏视频片段进行视觉编程。此外,Qwen3-VL特别强化了三维空间检测能力,使搭载该技术的设备能够更准确地判断物体方位和视角变化,实现精准操作。

目前,该系列模型已推出多个版本,涵盖从2B到235B等不同规模,每款均提供指令版和推理版两种模式,受到技术开发团队的广泛关注。普通用户也可通过官方应用免费体验相关功能。

SpatialBench作为近年来备受关注的专业测评体系,主要评估多模态模型在空间、结构和路径等方面的综合推理能力,其测试结果被视为衡量智能技术发展水平的重要参考指标之一。

举报

  • 相关推荐
  • AI日报:千问Qwen3-VL双子星开源;腾讯内测“上头蛙”AI互动故事小程序;小鹏祭出“物理世界大模型”

    本期AI日报聚焦多领域进展:阿里开源Qwen3-VL多模态检索模型,腾讯推出AI互动故事小程序“上头蛙”,小鹏发布第二代VLA模型剑指L4智驾。MiniMax港股上市首日暴涨42%,高德世界模型登顶国际榜单。阿里千问下载量突破7亿,单月击败Meta、OpenAI总和。谷歌Gmail引入AI专属收件箱与自然语言搜索,马斯克xAI进军“氛围编程”推Grok Build。

  • 三星携Spatial空间显示屏亮相CES 2026

    三星电子近日宣布,其Spatial空间显示屏荣获美国消费者技术协会颁发的CES 2026创新奖。这是三星商用显示产品首次在CES亮相并获此殊荣。该产品是一款裸眼3D+显示屏,能带来沉浸式视觉体验,通过突破性显示技术为二维画面赋予立体景深。其机身厚度仅52毫米,搭配85英寸极窄边框,可融入各类注重设计感的使用场景。得益于内置的三星VXT+平台,用户可跨设备远程部署店铺内容。凭借沉浸体验与广泛适用性,该产品成为CES 2026的热门展品。

  • 连投六轮!明势天使项目「MiniMax」正式登陆港交所,成史上IPO规模最大AI大模型公司

    2026年1月9日,AI公司MiniMax在香港联交所主板上市,成为史上IPO规模最大的AI大模型公司。明势资本作为其最早的投资方之一,自2022年3月公司创业初期便参与投资,并连续六轮加注,是参与融资轮次最多的机构。此次IPO定价165港元,盘中大涨97%,市值超千亿港元,市场反响热烈。明势资本通过长期支持,助力中国大模型企业登上全球舞台。

  • 国产全球最强医疗大模型Baichuan-M3发布:已超越GPT-5.2与人类医生

    AI大模型今年会向更专业的方向发起猛攻,除了AI编程之外,AI医疗也成为一大重点,OpenAI刚收购了一个医疗初创公司,Cluade也推出了AI医疗助手。 今天还有一家国产大模型新品也将目光瞄准了医疗,那就是Baichuan-M3,这是知名大佬王小川投资成立的百川智能发布的AI医疗大模型,号称全球最强。 据百川智能介绍,Baichuan-M3 专为医疗场景深度优化,融合海量医学文献、临床指南�

  • 2026视觉中国&500px视觉盛典永修站圆满收官

    1月11日,2026视觉中国500px视觉盛典在江西永修县吴城候鸟小镇成功举办,吸引超400位影像从业者与摄影爱好者参与。活动围绕自然、观察与创作三大主题展开深入交流,品牌大使分享了空间、结构与画面的观察视角,并带领摄影爱好者实地创作,记录湿地生态与生活细节。现场设置互动抽奖与品牌体验区,多家摄影设备品牌集中亮相。活动旨在以影像为纽带,推动“生态永修·世界共栖”摄影大赛落地,见证“候鸟摄影部落”成立,汇聚创作力量。2026年,视觉中国500px将继续走进更多城市,与摄影师共同记录与交流。

  • 20+大模型与70+智能体调度!李未可AI眼镜定义群体智能新范式

    文章以丹尼尔·卡尼曼的“快与慢”思维系统理论为引,介绍了李未可AI智能眼镜如何将AI融入人类最自然的“看、听、说”交互中。该产品通过“超能李未可”系统,结合自研大模型与多智能体协同的“群体智能”模式,实现了从快速直觉响应到深度理性思考的无缝衔接。它能高效处理实时翻译、信息查询等日常任务,并在需要时启动多专家智能体进行复杂规划与创意生成,致力于成为用户随身、随思、随需的“第二大脑”,让技术回归增强人类感知与创造能力的本质。

  • 花3000元让AI改口,大模型的尽头是广告?

    大模型界的翘楚OpenAI,面对每年数十亿美元的研发成本,正迎来一个艰难的决定:其员工正在琢磨如何让 ChatGPT 在用户提出相关问题时,优先显示赞助内容。 也就是说,当用户让大模型推荐一家眼镜店、一款工业传感器、一家民宿时,很可能大模型给出的是企业的软广。但大模型本身可能并不知道答案被“精心设计”过,它依然兢兢业业,会根据各个指标筛选出你想要的产品�

  • 京东京造第二批AI玩具全新上线:全年龄段覆盖 搭载JoyInside大模型

    京东京造1月19日上线第二批自研AI玩具,覆盖全年龄段用户需求。接入JoyInside智能系统的硬件产品,平均对话轮次增长超120%。多款产品上线后迅速售罄且退货率极低,市场反响热烈。在原有儿童陪伴玩具基础上,此次拓展了产品线,推出针对年轻人和老年人的AI玩具,包括专为银发人群设计的“唠唠鹦”,以及面向年轻人的“球球”和“墨墨”。“唠唠鹦”内置方言、养生知识、戏曲、评书等内容,并提供紧急呼救、健康服务联动、子女日志同步等守护功能。针对年轻人的产品则以情绪感知和善解人意为特点,能主动提供安慰与陪伴。

  • 从“看家”到“懂家”:海雀大模型摄像头,重塑家庭主动智能新范式

    1月8日至11日,海雀科技在阿里云通义千问智能硬件展上发布搭载AI大模型的海雀摄像头。该产品不仅是家用智能摄像头首次在设备端直接使用大模型,更标志着摄像头从被动记录工具向主动服务的AI伙伴转变。海雀摄像头能看、会听、会思考、会执行指令,深入家庭场景,为育儿家庭提供“全能陪聊搭子”与“安心守护者”,为有老人的家庭提供“可对话的养生助手”,并成为所有家庭的“智能管家”。通过千万用户数据,海雀精准切入需求,以“主动智能”引领行业,为AI硬件赛道提供了从技术堆砌到场景融合的参考范本。

  • 实时生成开放世界:新AI模型贴脸开大,游戏研发慌不慌?

    这两天,又有一款全新的AI模型出现了。 虽说如今AI改变各行各业的事情早就屡见不鲜,在游戏业,很多岗位也或多或少已经用上了AI技术,但最近发布的这款AI模型,它真不一样。 这款AI模型名叫PixVerse R1,按官方说法,PixVerse R1是全球首个真正意义上的「实时生成世界模型(Real-time World Model)」。

今日大家都在搜的词: