阿里开源多模态模型Qwen2.5-Omni：显存大幅降低暴降 50%

2025-05-01 09:45 · 来源： AIbase基地

在开源大模型的竞争中，阿里巴巴推出了其最新的多模态模型 Qwen2.5-Omni-3B。这款模型的显著特点是显存使用减少了50%，在同等处理能力下，更加适合普通消费者的 GPU 设备。这一创新标志着阿里在多模态人工智能领域的进一步突破。

Qwen2.5-Omni 是一款端到端的多模态模型，能够同时处理文本、图像、音频和视频等多种信息类型。得益于其独特的 “Thinker-Talker” 架构，模型能够在实时互动中灵活运用多种输入，生成相应的文本和自然语音回应。这种设计使得用户在与系统的互动中，能够获得更流畅、更自然的体验。

显存优化，兼容性增强

与 Qwen2.5-Omni-7B 模型相比，3B 版本在处理长上下文序列时，显存显著降低，使得其在24GB 的消费级 GPU 上仍能支持长达30秒的音视频交互。这一优化不仅提升了模型的适用性，也让更多用户能够在个人计算机上实现高效的多模态处理，解决了以往因显存不足导致的使用障碍。

实时语音与视频聊天功能

Qwen2.5-Omni 的核心优势之一是其支持完全实时的语音和视频聊天功能。该模型能够处理分块输入并即时输出响应，展现出卓越的鲁棒性和自然度。这种技术使得在语音生成方面，Qwen2.5-Omni 的表现超越了许多现有的流式和非流式模型，为用户提供了更加人性化的互动体验。

在多模态任务中，Qwen2.5-Omni 展现出令人瞩目的性能，无论是在单一模态任务，如语音识别、翻译、音频理解、图像推理，还是在需要多模态融合的复杂任务中，该模型都能表现出色。在与同规模的单模态模型对比中，Qwen2.5-Omni 不仅在音频能力上超越了 Qwen2-Audio，还在图像和视频任务中达到了与 Qwen2.5-VL-7B 相当的水平，证明了其多模态处理的强大能力。

github地址:https://github.com/QwenLM/Qwen2.5-Omni

在线体验:https://modelscope.cn/studios/Qwen/Qwen2.5-Omni-Demo

相关推荐

荐Qwen登顶AI赚钱大赛只是开始？“弃GPT投Qwen”已在硅谷蔓延开来

近期AI炒币大赛Alpha Arena引发关注，六款主流大模型用1万美元本金在币圈实战。戏剧性的是，被寄予厚望的GPT-5和Gemini因高杠杆操作亏损惨重，而中国开源模型表现亮眼——通义千问Qwen以53%回报率逆袭登顶，DeepSeek紧随其后。硅谷巨头Airbnb CEO公开表态依赖Qwen，投资人Chamath也承认将业务转向中国模型。市场用真金白银投票：预测平台押注Qwen胜率高达36%，远超OpenAI的3%。这场竞赛�

AI炒币大赛 Alpha Arena
荣耀年度旗舰上新，火山引擎助力“YOYO助理”多模态智慧再升级

10月15日，荣耀发布搭载全新MagicOS 10系统的Magic8系列手机、MagicPad3 Pro平板及荣耀手表5 Pro等旗舰新品。智能语音助手“YOYO助理”升级多模态交互能力，支持图文、语音、视频输入及多样化内容输出，结合火山引擎的豆包大模型技术，提供联网问答、智能识图、创意修图、出行规划等场景服务，实现“有问必答、答则精准”的智慧体验，成为用户贴身的“万能管家”。

荣耀Magic8系列 MagicOS10 YOYO助理
AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个模型尺寸；百川发布循环证据增强大模型

本文汇总AI领域最新动态：OpenAI推出集成ChatGPT的Atlas浏览器，实现多任务自主处理；阿里通义千问新增2B/32B视觉语言模型，手机可流畅运行；谷歌AI Studio升级Vibe Coding功能，简化应用开发流程；百川发布医疗大模型M2Plus，通过循证推理降低误诊率；奇瑞墨甲机器人实现L3级技术突破，计划多行业应用；YouTube推出AI肖像识别工具，打击虚假内容；三星宣布2026年推出AI眼镜，融合AR与语音助手；Claude客户端更新，支持截图分析和语音交互功能。

AI OpenAI ChatGPT
荐AI日报：阿里发布紧凑型Qwen3-VL模型；科大讯飞AI翻译耳机全球首发；Gemini代码惊现Veo3.1

阿里巴巴发布紧凑型Qwen3-VL多模态模型，推动边缘设备AI应用；科大讯飞推出全球首款AI翻译耳机，支持60种语言实时翻译；谷歌NotebookLM集成图像生成功能，可将笔记转为动态视频；ChatGPT将于12月向成人开放限制内容并推出自定义交互功能；谷歌Gemini代码泄露Veo3.1视频模型升级迹象；马斯克宣布X平台将全面转向AI推荐系统；巨人网络与清华联合开源多方言语音合成框架DiaMoE-TTS；vivo公布X200系列影像升级计划；字节跳动开源文本驱动高保真人脸生成模型FaceCLIP。

AI技术多模态模型边缘计算
荐AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；Sora2免费用户可生成15秒视频

本期AI日报聚焦多项技术更新：谷歌Veo 3.1视频模型新增音频生成与精细化编辑功能；通义千问推出记忆功能提升对话连贯性；Sora2免费用户可生成15秒视频，Pro版支持25秒；百度文心助手升级8种创作模式；谷歌Flow工具增强视频光影编辑与音频合成能力；Anthropic发布高性价比Claude Haiku 4.5；北京查处首例AI虚假广告案，涉伪造主持人带货；阿里推出响应仅200毫秒的编程工具Qoder CLI。

AI 视频生成谷歌
全新开源的DeepSeek-OCR，可能是最近最惊喜的模型。

AI圈虽然天天卷，但是很多的模型，真的越来越无聊了。每天就是跑分又多了几个点。直到昨天，DeepSeek久违的发了一个新模型。 DeepSeek-OCR。这玩意，是真的有点酷。

DeepSeek-OCR AI模型 OCR技术
司机跑500公里送盆栽遭拒收索赔倒贴了2000多元

近日，安徽六安的货车司机冯先生遭遇了一场运输纠纷，他原本以为能顺利完成的一单盆栽运输任务，最终却让他赔了夫人又折兵，500公里白跑不说，还倒贴了2000多元。据冯先生介绍，他此前接了一个运输盆栽的订单，需要将一棵高2.6米的盆栽运送到500公里外的地方，运费为600元。接单时，冯先生觉得自己的车厢高度完全能装下这棵盆栽，便爽快地答应了。然而，装货时�

货车运输纠纷盆栽运输问题运费争议
金蝶征信“金融风控大模型” 摘得AFAC2025大奖

一家社区水果店凭借收款码的36个月交易记录，将银行贷款额度从7万元提升至10万元。这揭示了中国超3亿商户正通过二维码流水数据构建数字信用体系：使用收款码满六个月的商户获贷可能性超60%，三年后跃升至90%。此类高频实时数据正重塑风控逻辑——不看抵押、不看报表，只忠实记录每笔交易背后的经营事实。金蝶征信凭借AI与知识图谱技术，穿透至6层交易链条，构建包含4.45亿交易关系的产业互联网图谱，助力金融机构实现精准信贷匹配。其智能风控系统已推动合作机构放贷额度提升50%，标志着风控模式从“经验驱动”向“数据智能驱动”的转型。

社区水果店贷款额度收款码融资
重2.7公斤的实心不锈钢手机壳：就是故意的！要价1500元

近日在众筹平台上出现了可以说是世界上最重的手机壳6磅手机壳（6 Pound Phone Case）”。这款由实心不锈钢打造的保护壳重达2.7公斤，比许多游戏笔记本电脑还要沉重，其设计的目的只有一个：帮助用户减少使用智能手机的时间。如今智能手机都在朝着轻薄化

手机壳不锈钢减少使用
专注供应链单据识别 | 运小沓AI单证平台，单据识别提效500%

供应链数字化进程中，单证处理效率低下是行业痛点。海运/空运托书、报关草单等核心单证格式复杂、人工录入易错，通用识别工具难以适配。运小藄AI单证平台通过自研大模型实现"无需定制、一键识别、精准高效"的智能处理，覆盖全场景单证类型，支持无缝对接业务系统。实际应用显示：托书录入效率提升500%，错误率降至0.1%以下；报关草单制单效率提升300%，有效解决"订舱等不起、报关错不起、定制用不起"三大难题。

供应链数字化转型单证处理效率瓶颈

今日大家都在搜的词：

热文

3 天
7天

阿里开源多模态模型Qwen2.5-Omni：显存大幅降低暴降 50%

荐Qwen登顶AI赚钱大赛只是开始？“弃GPT投Qwen”已在硅谷蔓延开来

荣耀年度旗舰上新，火山引擎助力“YOYO助理”多模态智慧再升级

AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个模型尺寸；百川发布循环证据增强大模型

荐AI日报：阿里发布紧凑型Qwen3-VL模型；科大讯飞AI翻译耳机全球首发；Gemini代码惊现Veo3.1

荐AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；Sora2免费用户可生成15秒视频

全新开源的DeepSeek-OCR，可能是最近最惊喜的模型。

司机跑500公里送盆栽遭拒收索赔倒贴了2000多元

金蝶征信“金融风控大模型” 摘得AFAC2025大奖

重2.7公斤的实心不锈钢手机壳：就是故意的！要价1500元

专注供应链单据识别 | 运小沓AI单证平台，单据识别提效500%

今日大家都在搜的词：

热文

五大升级！红米REDMI K90标准版采用6.59英寸黄金中尺寸

华为nova Flip S小折叠开售：首发3388元起

兰博基尼联名！REDMI K90 Pro Max冠军版官宣

微信三大更新放出上热搜涉及群聊消息处理、消息撤回等

AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个

红米REDMI K90标准版亮相：质感、工艺脱胎换骨

雷军回应K90定价：最近内存涨价太多希望大家理解这份诚意

REDMI K90标准版12+512GB降价300元小米回应：可退差价

苹果首款2nm手机芯片上热搜 A20由iPhone 18系列首发

华为鸿蒙HarmonyOS 6公测版开启推送

站长商机