阿里巴巴推大规模音频语言模型Qwen-Audio

2023-11-23 11:04 · 稿源：站长之家

要点:
阿里巴巴研究团队推出了Qwen-Audio系列，这是一组具有通用音频理解能力的大规模音频语言模型。
Qwen-Audio通过采用层次标签的多任务框架，成功应对了多样化任务的挑战，并在基准任务上取得了令人印象深刻的性能，无需特定任务的微调。
Qwen-Audio-Chat是在Qwen-Audio基础上构建的，支持多轮对话和各种音频中心场景，展示了其通用音频理解能力。

站长之家（ChinaZ.com）11月23日消息:阿里巴巴研究团队最近推出的Qwen-Audio系列为大规模音频语言模型领域带来了重大突破。该系列通过采用层次标签的多任务框架，成功解决了有限的预训练音频模型面临的多样化任务的挑战。

相比之前专注于语音的工作，Qwen-Audio不仅包含人类语音，还涵盖了自然声音、音乐和歌曲，实现了在具有不同粒度的数据集上的协同训练。该模型在语音感知和识别任务方面表现出色，而无需进行特定任务的修改。

Qwen-Audio的多任务框架有助于减轻干扰，实现了在基准任务上的显著性能。Qwen-Audio-Chat作为扩展，不仅支持多轮对话，还适用于各种音频中心场景，展示了在大规模音频语言模型中全面的音频交互能力。

项目地址:https://github.com/qwenlm/qwen-audio

尽管大规模语言模型在通用人工智能方面表现出色，但它们缺乏对音频的理解。Qwen-Audio系列的推出填补了这一空白，将预训练扩展到30个任务和多种音频类型。

Qwen-Audio系列的训练方法分为两种:Qwen-Audio采用多任务预训练方法，优化音频编码器同时冻结语言模型权重;相反，Qwen-Audio-Chat采用监督微调，优化语言模型同时固定音频编码器权重。这一训练过程包括多任务预训练和监督微调，使Qwen-Audio-Chat具有多样的人际交互能力，支持从音频和文本输入中的多语言、多轮对话。

Qwen-Audio在各种基准任务上表现出色，明显优于没有特定任务微调的对照组。它在AAC、SWRT ASC、SER、AQA、VSC和MNA等任务上始终超越基线，同时在CochlScene、ClothoAQA和VocalSound上取得了最先进的结果，展示了其在挑战性音频任务中的有效性和能力。

Qwen-Audio系列未来的探索方向包括扩展不同音频类型、语言和特定任务的能力。通过优化多任务框架或探索替代的知识共享方法，可以解决协同训练中的干扰问题。

研究人员还计划通过不断更新基于新基准、数据集和用户反馈的内容，提高通用音频理解水平。Qwen-Audio-Chat将进一步优化以符合人类意图，支持多语言互动，并实现动态多轮对话。

（举报）

相关推荐

关键词：

阿里巴巴

荐AI+大消费的首个双11，商家借阿里妈妈实现首波爆发

10月15日晚八点，天猫正式开启了2025年度双11预售，预售首小时，便有35个品牌成交破亿，1802个品牌成交翻倍，破亿品牌数、成交翻倍品牌数、活跃用户数均超去年同周期。淘宝天猫作为双11的主阵地，再一次见证了无数优秀品牌商家的高光时刻。作为首个AI全面落地的双11，这场品牌生意集体爆发盛景的背后，阿里妈妈对商家经营的赋能作用，已悄然融入每一个关键节点。在

双11预售天猫双11 阿里妈妈
荐史上首个“AI+大消费”双11，阿里妈妈助力这些商家先“赢”一步

2025天猫双11将于明晚8点正式开卖。此前，双11预售于10月15日晚8点正式开启。数据显示，预售首小时有35个品牌成交破亿，1802个品牌成交翻倍，破亿品牌数、成交翻倍品牌数、活跃用户数均超去年同周期。 “AI+大消费”驱动的双11迎来全新局面。商家侧的显著增长，离不开阿里妈妈的AI产品升级。今年9月，阿里妈妈将万相台无界版升级为万相台AI无界，以全新的AI投放能力帮

天猫双11 阿里妈妈 AI投放
太突然！阿里巴巴又做了一个天猫……

原天猫淘宝总裁蒋凡正式接管阿里海外数字商业板块不到1个月，“三把火”已经燎动...就在2021年年底，全球速卖通——阿里海外数字商业的核心阵地之一，接连放出四大调整政策，对平台商家做了一轮“大整顿”：...重新做资源分配...”亿邦动力向速卖通方面予以求证，速卖通商家商品运营相关人员指出，品牌化和合规化是整个行业的大势所趋，也是国家政策及国际政策主导的方向......

阿里巴巴速卖通天猫
阿里巴巴市值登顶亚洲第一再造几个“阿里巴巴”

截至周五美股收盘，阿里巴巴集团（股票代码：BABA）在纽交所股价上涨0.18%，收盘价为104.64美元，市值约合2664.13亿美元。阿里巴巴就此登顶亚洲所有上市公司市值首位。十年布局，从核心电商，到支付与金融、大数据云计算、大文娱、智能物流网络，阿里在十年间“再造”了几个阿里巴巴。

阿里巴巴腾讯市值
AI日报：腾讯发布全新ima2.0;微软发布 Copilot 一系列重磅更新；阿里夸克AI眼镜开启预售

本文汇总近期AI领域重要动态：月之暗面再获数亿美元融资，显示资本对国产大模型的信心；Anthropic为Claude推出记忆功能，兼顾个性化与隐私保护；中科大与字节发布MoGA长视频生成模型，实现分钟级高质量生成；腾讯ima2.0升级任务模式，可自主拆解复杂流程；阿里夸克AI眼镜开启预售，融合拍摄与智能功能；微软Copilot新增群聊、记忆与Edge AI模式；Opera推出深度研究代理ODRA提升�

AI 大模型 Kimi
阿里云与天猫启动“AI新品类联合计划” ，支持智能硬件规模化发展

2025年9月24日，阿里云与天猫在杭州云栖大会联合启动“AI新品类联合计划”，旨在依托阿里云AI技术及天猫电商平台，为智能硬件企业构建从产品创新到商业落地的闭环。计划覆盖XR设备、机器人、无人机等品类，提供专项组织保障、定制化政策、资源倾斜及技术支持。双方将共同推动AI硬件产业发展，天猫平台已优化eSIM服务、搜索推荐、以旧换新及渠道对接，助力产品转化。数据显示，智能眼镜、机器人等品类增长显著，平台生态持续扩大，AI硬件将成为2025年双十一大促重点品类。

AI新品类智能硬件阿里云天猫合作
反转！阿里巴巴成功禁止“阿里巴巴币”公司使用其商标

据报道， 10 月 22 日，美国纽约南区地方法院批准了阿里巴巴的请求，禁止总部位于迪拜的Alibabacoin侵犯其商标。

阿里巴巴
刘涛入职阿里巴巴是怎么回事？阿里巴巴入职要求

日前刘涛发微博宣布，自己正式加入阿里巴巴大家庭，成为了聚划算官方优选官，花名刘一刀，并且晒出了工牌。

刘涛入职阿里巴巴刘一刀阿里巴巴
阿里巴巴赢得针对加密货币阿里巴巴初步商标禁令

据外媒报道，在起诉加密货币公司Alibabacoin Foundation侵犯商标权一案中，中国电商巨头阿里巴巴向美国法庭申请的针对Alibabacoin公司的初步商标使用禁令已得到批准。

阿里巴巴加密货币
阿里巴巴委任利蕴莲及吴港平为独立董事

阿里巴巴发布公告宣布，委任希慎兴业集团有限公司执行主席利蕴莲，以及安永会计师事务所中国前主席吴港平为集团董事会独立董事，于2022年8月4日起生效...阿里巴巴发布公告，委任希慎兴业集团有限公司执行主席利蕴莲，以及安永会计师事务所中国前主席吴港平为集团董事会独立董事，于2022年8月4日起生效...她于2011年5月至2012年3月担任希慎兴业的非执行主席，以及于2011年3月至2011年5月担任非执行董事...资料显示，利蕴莲现于香港联交所上市的恒生银行有限公司之独立非执行董事长...

阿里巴巴利蕴莲吴港平

今日大家都在搜的词：

热文

3 天
7天

阿里巴巴推大规模音频语言模型Qwen-Audio

荐AI+大消费的首个双11，商家借阿里妈妈实现首波爆发

荐史上首个“AI+大消费”双11，阿里妈妈助力这些商家先“赢”一步

太突然！阿里巴巴又做了一个天猫……

阿里巴巴市值登顶亚洲第一再造几个“阿里巴巴”

AI日报：腾讯发布全新ima2.0;微软发布 Copilot 一系列重磅更新；阿里夸克AI眼镜开启预售

阿里云与天猫启动“AI新品类联合计划” ，支持智能硬件规模化发展

反转！阿里巴巴成功禁止“阿里巴巴币”公司使用其商标

刘涛入职阿里巴巴是怎么回事？阿里巴巴入职要求

阿里巴巴赢得针对加密货币阿里巴巴初步商标禁令

阿里巴巴委任利蕴莲及吴港平为独立董事

今日大家都在搜的词：

热文

华为nova Flip S小折叠开售：首发3388元起

雷军回应K90定价：最近内存涨价太多希望大家理解这份诚意

苹果首款2nm手机芯片上热搜 A20由iPhone 18系列首发

REDMI K90标准版12+512GB降价300元小米回应：可退差价

小米汽车发布跨年购置税补贴方案至高不超15000元

卢伟冰：REDMI K90标准版12+512首销月直降300 售价2899元

五大升级！红米REDMI K90标准版采用6.59英寸黄金中尺寸

AI日报：阿里夸克“C计划”曝光；Veo3.1将增加视频“精确编辑”

iOS 26液态玻璃效果能关了苹果iOS 26.1 Beta 4新增液态玻璃开

兰博基尼联名！REDMI K90 Pro Max冠军版官宣

华为nova Flip S小折叠开售：首发3388元起

微信三大更新放出上热搜涉及群聊消息处理、消息撤回等

真我GT8发布：售价2899元起骁龙8至尊版双芯

AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个

余承东官宣华为路由X3 Pro 采用“日照金山”设计

红米REDMI K90标准版亮相：质感、工艺脱胎换骨

站长商机