Meta 开源 MusicGen 模型：用 AI 将文本和旋律结合创造全新音乐作品

2023-06-12 16:23 · 稿源：站长之家

站长之家(ChinaZ.com) 6月12日消息:Meta 的 MusicGen 可以根据文本提示生成短小的新音乐片段，并可选择与现有旋律对齐。

Meta，元宇宙，Facebook

与今天的大多数语言模型一样，MusicGen 基于 Transformer 模型。就像语言模型预测句子中的下一个字符一样，MusicGen 预测音乐作品中的下一个部分。

研究人员使用 Meta 的 EnCodec 音频标记器将音频数据分解为较小的组件。作为一个单阶段模型，它可以并行处理标记，因此 MusicGen 速度快且高效。

该团队使用了 20,000 小时的授权音乐进行训练。特别的是，他们依赖于一组内部的 10,000 首高质量音乐曲目的数据集，以及来自 Shutterstock 和 Pond5 的音乐数据。

MusicGen 可以处理文本和音乐提示

除了架构的效率和生成速度外，MusicGen 在能够处理文本和音乐提示方面也是独特的。文本设置了基本风格，然后与音频文件中的旋律匹配。

例如，如果将文本提示「一个轻快愉快的 EDM 音轨，带有交响鼓、轻柔垫音和强烈情感，速度：130 BPM」与巴赫著名作品《降 D 小调的触技曲与赋格曲（BWV 565）》的旋律结合起来，将生成以下音乐作品：

你无法精确控制与旋律的结合，例如在不同风格中听到旋律。它只作为生成的大致指南，并不完全反映在输出中。

MusicGen 领先于 Google 的 MusicLM

研究的作者对其模型的三个不同大小进行了测试：3 亿（300M）、15 亿（1.5B）和 33 亿（3.3B）个参数。他们发现更大的模型生成的音频质量更高，但人们评价最好的是 15 亿参数模型。另一方面，33 亿参数模型更擅长准确匹配文本输入和音频输出。

与其他音乐模型（如 Riffusion、Mousai、MusicLM 和 Noise2Music）相比，MusicGen 在客观和主观指标上表现更好，这些指标测试音乐与歌词的匹配程度以及作曲的可信度。总体而言，这些模型略高于Google 的 MusicLM 水平。

Meta 已在 Github 上发布了代码和模型的开源版本，并允许商业使用。在 Huggingface 上提供了演示。

Github 代码和模型：https://github.com/facebookresearch/audiocraft

Huggingface演示：https://huggingface.co/spaces/facebook/MusicGen

（举报）

相关推荐

关键词：

共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

10月28日，AtomGit平台在北京国家会议中心举行升级发布会，正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞，强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源，打造开放中立的基础设施，计划于11月21日正式上线。华为、百度等企业代表分享了开源实践，多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

开源社区人工智能 AtomGit
厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

10月28日，麒麟信安人工智能孵化器在长沙启动，旨在汇聚AI领域人才、技术与资本，构建开放协同的创新生态。该项目获湖南省多部门支持，已吸引60余个项目入围，组建了首批30余位专家导师团，并与多家顶尖机构共建联合体，通过政策扶持、资本对接等多维度赋能，培育优质AI项目在湘落地发展，助力区域打造人工智能产业创新高地。

人工智能孵化器麒麟信安创新创业
人工智能巨头OpenAI拟上市估值或高达1万亿美元

OpenAI正积极推进上市计划，据知情人士透露，该公司可能最早于2026年下半年向证券监管机构提交上市申请，目标在2027年正式上市。此次IPO的估值有望达到约1万亿美元，或将跻身全球规模最大的IPO之列。在初步讨论中，OpenAI曾考虑通过上市筹集至少600亿美元资金，实际融资规模可能进一步扩大。

OpenAI IPO 上市计划
人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

科杰科技董事善于洋在2025中国国际数字经济博览会发表演讲，强调高质量数据集是人工智能产业决胜关键。他指出，算力、算法和数据构成AI三大要素，而数据决定模型认知边界与输出可靠性。当前需构建Data&AI一体化平台作为核心基础设施，通过集中管理、分散赋能模式，打通数据采集、治理到AI训练全链路，推动产业智能化升级。该平台已在制造、金融等领域落地，助力企业释放数据要素价值，实现弯道超车。

人工智能数据基础设施数字经济
卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

卖家精灵凭借在跨境电商智能化运营与AI大数据应用领域的领先实力，近日正式加入中国人工智能产业发展联盟（AIIA），成为该国家级AI产业生态重要成员。此次加入标志着其AI技术实力获权威认可，未来将携手联盟推动AI技术研发与产业化，助力中国品牌全球化。依托八年积累的海量电商数据与算法体系，卖家精灵已构建覆盖选品决策、市场分析等全链路AI解决方案，服务超百万跨境卖家，显著提升运营效率与决策精准度。

人工智能跨境电商 AI大数据
行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

2025年10月，海尔冰箱成为全球首个通过ISO/IEC42001人工智能管理体系认证的家电企业，标志着其AI技术研发与管理达国际领先水平。该认证覆盖语音交互、视觉识别、健康保鲜等核心功能全流程，确保用户数据安全与隐私保护。目前AI系统已应用于博观、麦浪等高端产品，推动智能冰箱行业规范化发展。未来海尔将持续优化AI技术，为用户提供更安全、智能的健康饮食体验。

冰箱品牌人工智能技术海尔冰箱
国内首个！火山引擎推出融合国家级智库理论与大规模实战验证的 Data Agent 评测体系

火山引擎推出国内首个融合国家智库理论框架与大规模实战验证的数据智能体评测体系，同步发布《2025数据智能体实践指南》。该体系直面传统评测重技术轻业务、预设答案难适配动态场景、局部能力检验不足三大痛点，确立业务关联性、可操作性与前瞻性设计原则。覆盖分析洞察、可视化呈现、鲁棒性三大核心维度，通过151道测试题量化智能体能力并划分达标/工业可用/专业研究三级标准。采用标准化闭环流程与自动化评分机制，为数字化转型深水区企业提供选型优化依据，推动产业智能化进入精准量化新阶段。

数据智能体评测体系多模态数据
TabTab 登顶模力工场 AI 应用榜榜首，把 AI 数据分析师装进口袋，关键结论更快抵达！

TabTab是一款全链路AI数据分析助手，核心功能包括多源数据连接（支持文档、数据库、电商平台等）、自动化采集清洗、内置分析模型及可视化呈现。其优势在于通过多智能体系统实现自然语言交互，降低分析门槛，让非技术人员也能快速完成客户洞察、销售业绩等分析，显著提升效率。产品定位中立，致力于构建多元化AI效率提升生态。

数据驱动效率提升智能体
荐AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏览器推出AI+小窗

本期AI日报聚焦多项技术突破：HeyGen推出精准唇形同步的视频翻译引擎；科大讯飞发布星火X1.5大模型，提升多语言处理能力；QQ浏览器新增AI助手浮窗；科大讯飞推出软硬一体方案，实现高噪声环境精准识别；谷歌Gemini 3 Pro预览版支持百万级上下文窗口；Comfy Cloud让Stable Diffusion实现零门槛创作；谷歌Gemini新增深度研究功能，可整合邮件生成智能报告；上海AgiBot机器人10分钟完成复杂制造任务，重塑生产效率。

AI视频翻译唇形同步跨语言本地化
数巅完成数亿元pre-A轮融资，领跑企业级AI Agent赛道

北京数巅科技完成数亿元Pre-A轮融资，由济和创投与赛富基金领投。资金将用于产品研发、国内市场深耕及国际市场拓展，强化其Data Agent技术在行业落地方面的领先优势。数巅推出企业级Data Agent解决方案，通过模块化架构整合海量行业知识与企业数据，精准识别用户需求，实现秒级响应与深度推理，满足企业数据分析、智能报告生成及业务决策等需求。该方案已在多家央国企及金融机构落地，查数准确率超99%，成为国内企业级智能体应用的重要里程碑。

融资 AI Agent

今日大家都在搜的词：

热文

3 天
7天

Meta 开源 MusicGen 模型：用 AI 将文本和旋律结合创造全新音乐作品

共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

人工智能巨头OpenAI拟上市估值或高达1万亿美元

人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

国内首个！火山引擎推出融合国家级智库理论与大规模实战验证的 Data Agent 评测体系

TabTab 登顶模力工场 AI 应用榜榜首，把 AI 数据分析师装进口袋，关键结论更快抵达！

荐AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏览器推出AI+小窗

数巅完成数亿元pre-A轮融资，领跑企业级AI Agent赛道

今日大家都在搜的词：

热文

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

华为Mate70 Air官宣今日开启预售

AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏

何小鹏回应机器人IRON里是真人质疑：感谢认可

华为路由X3 Pro今日开启预售：售价1299元起

文件传输工具奶牛快传宣布12月8日正式停止服务

何小鹏首次披露物理AI巨大进展发布第二代VLA大模型

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

鸿蒙HarmonyOS 6与iOS数据互传功能预计12月上线

阿里回应饿了么更名：正处于灰度测试阶段

AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功

DeepSeek崩了上热搜页面显示“服务器繁忙”

特斯拉Cybercab不配备方向盘和踏板预计2026年二季度下线

马斯克称若发现外星人证据就公开

AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear

OPPO ColorOS 16正式版11月升级机型公布：支持23款机型

站长商机

Meta 开源 MusicGen 模型：用 AI 将文本和旋律结合 创造全新音乐作品

今日大家都在搜的词：

热文

站长商机

Meta 开源 MusicGen 模型：用 AI 将文本和旋律结合创造全新音乐作品