首页 > 业界 > 关键词  > 阿里云最新资讯  > 正文

手机也能跑的模型来了!阿里宣布开源Qwen2.5-Omni-7B

2025-03-27 15:07 · 稿源: 快科技

快科技3月27日消息,今天,阿里云宣布通义千问Qwen2.5-Omni-7B正式开源。

这是通义系列模型中首个端到端全模态大模型可同时处理文本、图像、音频和视频等多种输入,并实时生成文本与自然语音合成输出。

权威多模态融合任务OmniBench等测评中,Qwen2.5-Omni刷新业界纪录,全维度远超谷歌的Gemini-1.5-Pro等同类模型。

阿里云表示,相较于动辄数千亿参数的闭源大模型,Qwen2.5-Omni以7B的小尺寸让全模态大模型在产业上的广泛应用成为可能。

即便在手机上,也能部署和应用Qwen2.5-Omni模型。

目前,Qwen2.5-Omni已在魔搭社区和Hugging Face 同步开源,用户也可在Qwen Chat上直接体验。

手机也能跑的模型来了!阿里宣布开源Qwen2.5-Omni-7B

据悉,2023年起,通义团队陆续开发覆盖0.5B、1.5B、3B、7B、14B、32B、72B、110B等参数的200多款全尺寸大模型,囊括文本生成模型、视觉理解/生成模型、语音理解/生成模型、文生图及视频模型等全模态。

开源地址:

https://huggingface.co/Qwen/Qwen2.5-Omni-7B

https://modelscope.cn/models/Qwen/Qwen2.5-Omni-7B

https://github.com/QwenLM/Qwen2.5-Omni

举报

  • 相关推荐
  • AI日报:字节开源统一多模态大模型Lance 3B;智谱发布GLM-5.1高速版;CapCut与Gemini合作推出深度集成

    本期AI日报聚焦8大热点:字节跳动开源3B参数多模态大模型Lance,实现图像视频理解与生成统一;智谱发布GLM-5.1高速版API,以400 tokens/s刷新全球纪录;CapCut与Gemini合作实现AI创作智能互联;OpenAI推出ChatGPT for PowerPoint插件,一句话生成PPT;WordPress 7.0原生集成AI,开启智能建站新时代;Spotify联手环球音乐推出正版AI翻唱与混音功能;美团开源LongCat-Video-Avatar1.5数字人视频生成模型,�

  • 阿里发布千问旗舰模型Qwen3.7-Max

    阿里巴巴在今日开幕的2026阿里云峰会上,投下了一枚重磅炸弹——全新一代千问旗舰模型Qwen3.7-Max正式亮相。在第三方机构Arena公布的全球大模型盲测总榜中,这款模型超越Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1等国产竞品,与GPT、Claude、Gemini等最强模型同处第一梯队,成功登顶国产模型榜首。 这已经是千问旗舰模型在短短三个月内完成的第三次重大迭代,从3.5到3.6再到3.7,阿里大模型

  • 千问正式接入全新一代大模型Qwen3.7-Max:免费用

    近期,阿里巴巴发布全新一代千问旗舰模型Qwen3.7-Max,千问APP、PC端及网页端同步接入。 将千问APP更新至最新版(6.9.7及以上)后,点击下方胶囊Qwen3.7-Max”,或在PC端及网页端对话界面的模型选择栏”中进行下拉切换,即可第一时间免费体验。

  • 谷歌推出Gemini Go:2GB内存手机也能跑大模型

    谷歌为Android Go系统推出全新Gemini Go AI助手,专为内存超2GB的低配设备设计。该精简版大模型取代Google Assistant Go,用户无需下载独立应用,长按Home键或电源键即可唤醒。它支持拨打电话、发短信、查询地图、搜索餐厅、设置闹钟等日常功能,还能上传文档和照片以提供更自然的对话体验。目前,Gemini Go已开始分阶段向符合条件的设备推送。

  • 阿里语音大模型在Speech Arena斩获国内第一 全球排名第五

    在全球权威AI评测平台Artificial Analysis的语音排行榜(Speech Arena)上,阿里巴巴语音大模型Fun-Realtime-TTS-Preview以1190分的Elo评分位列全球第五、国产第一。 在ASR(将语音转为文字)、Chat(端到端的语音理解与对话)以及TTS(将文字转为语音)三个核心赛道,该模型均斩获全国第一,实现语音交互领域的大满贯”。 语音大模型的能力可拆解为三个层次:听得准(ASR)、说得好(TT

  • 小米自研大模型MiMo-V2.5系列API永久降价:最高降99% 不再区分上下文长度

    今日,小米宣布,旗下MiMo-V2.5系列大模型API迎来永久降价。 据介绍,相比原始API定价,MiMo-V2.5系列新价格最高降幅可达99%,并且不再区分上下文窗口长度。 本次调价已于北京时间5月27日0:00正式生效,全球同步调整。 具体来看,此次降价覆盖MiMo-V2.5和MiMo-V2.5 Pro两个版本。

  • 小米超高端手机下半年发布:玄戒芯片+OS+AI大模型大会师!全自研

    小米将于下半年发布一款超高端新品,属于MIX系列,可能命名为MIX Fold 5,搭载自研玄戒O3旗舰SoC(3nm制程、超大核4.05Ghz等)、澎湃OS 4系统(底层重构提升流畅度)和自研MiMo大模型(MiMo-V2.5系列全球领先)。该产品并非小米17S Pro,而是新一代大折叠屏手机,此外MIX系列还规划了一款直板机,带模块化磁吸镜头量产方案,两款机型预计Q3发布,最快7月亮相。

  • AI日报:阿里上线首个官方大模型NBA Chat; Ideogram4.0开源发布;OpenAI升级ChatGPT记忆系统

    今日AI领域动态:Ideogram 4.0开源发布,93亿参数打造最强文字生成AI,提升海报与品牌营销创作;OpenAI升级ChatGPT记忆系统,算力降至1/5,解决过时与准确性痛点;腾讯文档推出行业首创“人机双写”原生编辑器;xAI发布Grok Imagine Video 1.5,支持图片转视频;豆包回应AI识别野生蘑菇误判,强调仅供参考;知乎Q1扭亏为盈,AI短剧成增长点;腾讯云ADP 4.0新增Claw模式,提升企业Agent构建效率;NBA中国与阿里推出首个官方大模型“NBA Chat”。

  • AI日报:MiniMax发布M3 大模型;英伟达物理大模型Cosmos3发布;小红书已治理超120万个AI托管账号

    今日AI领域动态丰富:MiniMax发布M3+大模型,首创MSA架构并支持1M上下文,全面开源对标海外旗舰;英伟达联合行业巨头发布全球首款全开源全模态物理AI大模型Cosmos3,成立宇宙联盟;千问APP六一期间礼品选购咨询量增长260%,展现AI购物潜力;小红书治理超120万AI托管账号,处置18万篇AI造假笔记;抖音4月新增AI短剧超4.4万部,但爆款率仅0.6%;胡彦斌上线粉丝社区应用“彦火”,展示Vibe Coding潜力;LobsterAI推出图片视频大模型矩阵,整合四大主流模型;OpenAI重启机器人业务,奥特曼公开招募工程师,拓展具身智能布局。

  • 「超级AI日」高能上线!阿里云×天猫618强势联动,助力千问智能硬件成交爆发!

    6月6日,阿里云联合天猫上线618“超级AI日”品类日,作为520峰会上“千问智能硬件×天猫合作计划”的关键落地行动,通过专属会场、流量扶持及国补叠券等组合举措,全力助推搭载千问大模型的AI硬件成交爆发。活动汇聚萤石、声阔、乐橙等品牌,覆盖电视、摄像头、智能门锁等AI新物种,产品深度集成千问大模型,具备语音理解、多模态交互、自主任务规划等能力,实现从被动响应到主动服务的升级。同日发布旗舰模型Qwen3.7-Max及全模态模型Qwen3.5-Omni,后者在音视频理解等215项任务中达SOTA,并展现Vibe Coding能力。阿里云与天猫投入1亿+资源,从技术、商业、品牌三维度支持硬件厂商,共建AI原生硬件生态,推动千问赋能千行百业,融入千家万户。

今日大家都在搜的词: