首页 > AI头条  > 正文

阿里 Qwen-VL-30B-A3B 新模型发布 数学、视频处理性能获称更强

2025-10-06 10:28 · 来源: AIbase基地

阿里巴巴 **Qwen(通义千问)**团队近日发布了两个新的小规模多模态模型:Qwen3-VL-30B-A3B-InstructQwen3-VL-30B-A3B-Thinking。每个模型拥有 30亿个活跃参数,但在性能上却有着巨大的野心。

阿里通义qwen

据 Qwen 团队介绍,这两个新版本旨在与 GPT-5-Mini 和 Claude4Sonnet 等顶尖模型竞争,并在某些基准测试中,在数学、图像识别、文本识别、视频处理和代理控制等关键领域展现出更强的性能。

这一系列产品还包括一个用于更快推理的 FP8版本,以及 Qwen3-VL-235B-A22B 模型的 FP8变体。

这些模型已全面开放获取,用户和开发者可以通过 HuggingFace、ModelScope 和 GitHub 下载使用,也可通过阿里云 API 调用。此外,Qwen 也提供了一个可直接使用的网页聊天界面。这一发布强调了 Qwen 团队在推动高效、高性能小模型普及化方面的努力。

  • 相关推荐
  • Qwen3-Max成阿里通义“地表最强”:性能超GPT5 数学推理直接满分

    9月24日,2025云栖大会开幕,阿里通义千问旗舰模型Qwen3-Max重磅亮相,性能超越GPT-5、Claude+Opus 4等,跻身全球前三。该模型包含指令和推理两大版本,预训练数据量达36T tokens,总参数超万亿,具备极强编程和工具调用能力。在SWE-Bench测试中,指令版斩获69.6分全球第一;Tau2-Bench工具调用测试达74.8分,超越同类模型。推理增强版Qwen3-Max-Thinking在数学推理测试中获满分,国内首次突破。通义千问系列已实现全尺寸覆盖,包含三百多个模型。即日起,用户可在QwenChat免费体验Qwen3-Max,或通过阿里云百炼平台调用API服务。

  • AI日报:阿里推多模态模型Qwen3-Omni;谷歌推出AP2协议;百度推出Qianfan-VL 模型

    本期AI日报聚焦多领域技术突破:阿里云推出全球首个全模态AI模型Qwen3-Omni,支持文本、图像、音频和视频统一处理;百度发布多尺寸视觉理解模型Qianfan-VL,优化企业级应用。苹果扩展Image Playground平台,引入ChatGPT等第三方模型。谷歌与PayPal合作推出AP2协议,推动AI支付安全创新。钉钉上线AI表格助手,支持自然语言生成表格。DeepSeek开源V3.1-Terminus模型,性能显著提升。Kimi推出Agent会员服务,智元机器人开源全球首个通用具身智能模型GO-1,降低技术门槛促进行业创新。

  • 性能超越GPT-4o及Qwen2.5-VL,百度超轻量小模型PP-OCRv5 Blog持续登顶Hugging Face热度第一

    百度发布超轻量级文字识别模型PP-OCRv5,仅0.07B参数却实现媲美700亿参数大模型的OCR精度。在多项测试中超越GPT-4o等通用视觉大模型,尤其在文本定位和边界框精度上表现优异。该模型支持5种文字类型识别,适用于教育、医疗、法律等多行业数字化需求,累计下载量超900万,是GitHub上唯一Star数超5万的中国OCR项目。

  • BYDFi 亮相 KBW2025:深化 Web3 交流与参与

    全球加密交易平台于2025年9月23日至24日参与韩国首尔举办的Korea Blockchain Week 2025(KBW2025),在Walkerhill酒店主会场设置展位并开展现场互动。这是BY DFi成为纽卡斯尔联队官方合作伙伴后首次亮相大型行业活动,团队还出席多场边会及社交活动。在展会分享其“双引擎战略”——同步布局中心化与链上交易,重点介绍链上工具MoonX,强调通过安全设计、产品完善及合规进�

  • AI日报:接入MJ!夸克发布造点AI;Wan2.5-Preview发布;可灵推最新视频生成模型可灵2.5Turbo

    近日AI领域迎来多项重要更新:阿里夸克发布AI创作平台“造点”,整合通义万相Wan2.5与Midjourney V7,支持音画同步视频生成;Wan2.5-Preview实现多模态输入与电影级视频同步生成,提升视觉创作能力;可灵AI推出视频生成模型2.5Turbo并降价30%,降低使用门槛;阿里通义推出Qwen3-ASR-Toolkit,实现小时级音视频转录;谷歌相册AI编辑功能扩展至安卓用户,支持语音修图;谷歌Mixboard工具助力创意设计,生成情绪板;Qwen发布Qwen3-Max模型,在代码生成与智能体能力表现突出;Figma推出MCP服务器,实现设计到代码的一键转换,提升开发效率。

  • 市值一日暴增近3000亿港元,阿里迈向超级人工智能之路

    9月24日,阿里巴巴股价创下四年新高,单日涨超9%,市值达到约3.32万亿港元,一日增加近3000亿港元。 引爆股价的,是阿里集团每年一度的云栖大会。在会上,阿里释放多条重磅消息,尤其是在阿里集团CEO、阿里云智能集团董事长兼CEO吴泳铭的演讲结束后,阿里的股价表现就出现了明显的拉升。

  • 科研抗老新突破!HBN推出新品双A醇晚霜3.0

    HBN品牌六周年之际在上海举办“循迹·求真之旅”护肤讲堂,发布新品“双A醇晚霜3.0”。活动汇聚学界、医界权威,探讨抗老科研前沿与功效护肤趋势。刘玲玲教授分享皮肤衰老临床干预策略,刘玮教授解析系统性衰老生物标志物研究进展。新品基于扎实科研,联合重庆大学、浙大医学院研究A醇抗衰新机制,成果发表于高分期刊。双A醇晚霜3.0创新提出三维“细胞生态网”理念,整合三大自研原料:补骨脂阿魏酸酯实现高效温和,乙基三肽-30瓜氨酸提升皮肤弹性,昆仑雪菊提取物舒缓抗氧。产品质地轻薄易吸收,从根源改善松弛、下垂、皱纹问题,开启系统性抗老新时代。

  • vivo X300系列首发索尼LYT-828:挑战专业视频能力

    9月26日,vivo举行X系列影像技术沟通会,发布X300系列影像细节。该系列首发索尼LYT-828传感器,搭载Hybrid Frame-HDR技术,动态范围达100dB,配合云台级防抖,夜景和逆光表现出色。vivo与MediaTek联合重构视频通路,实现多焦段4K 120fps杜比视界HDR视频录制,支持安卓首发的4K 120fps双轨EIS防抖及ACES工作流认证,为后期创作提供空间。X300 Pro还独家首发剪映APP,支持4K 120fps视频编辑导出,实现拍摄到分享的无缝专业体验。此外,长达5小时43分钟的4K 60帧稳定录制能力解决了专业创作者的续航焦虑,使X300系列在视频创作各环节具备与行业顶级选手竞争的实力。

  • AI日报:蚂蚁开源高性能思考模型Ring-flash-2.0;通义7款模型屠榜Hugging Face;Veo3视觉能力升级

    蚂蚁百灵团队开源高性能思考模型Ring-flash-2.0,在多项基准测试中表现优异;阿里通义7款模型登顶Hugging Face榜单,Qwen3-Omni凭借多模态能力全球第一。谷歌Veo3突破视频生成局限,可自动完成视觉任务;特斯拉推进人形机器人量产,马斯克称其为最重要产品。马斯克第六次起诉OpenAI窃取商业机密,苹果内部测试聊天机器人Veritas优化Siri,YouTube推出AI音乐主播增强互动,LiquidAI发布轻量级模型Liquid Nanos优化边缘计算。

  • vivo X300系列行业首发4K 60帧电影人像视频:出巨片

    9月26日,vivo举办X系列蓝图影像技术沟通会,正式发布X300系列。该系列首发行业首个4K 60帧电影人像视频,支持人像美颜、虚化及冷胶等多种风格,搭载天玑9500旗舰芯片和自研影像芯片V3+,实现画质、美化和流畅度全面升级。新增冷胶、负片风格,支持双焦段4K 120fps慢动作、杜比视界HDR及10bit Log视频,夜景人像通过“电子柔光箱”算法提升光线柔和度30%,搭配闪光灯和烟花人像算法,软硬协同优化拍摄体验。vivo美学算法升级,蔡司自然人像还原原生感,肌肤纹理立体细腻,经典通透人像更真实清透。

今日大家都在搜的词: