Meta 发布利用文本创作音乐的开源 AudioCraft AI：「可能是类比合成器的新型乐器」

2023-08-03 09:06 · 稿源：站长之家

站长之家(ChinaZ.com) 8月3日消息:Meta 周三推出了名为 AudioCraft 的开源人工智能工具，该工具将帮助用户根据文本提示创建音乐和音频。它允许用户完全通过生成式 AI 创作音乐和声音。

Meta，元宇宙，Facebook

Meta 表示，该人工智能工具捆绑了 AudioGen、EnCodec 和 MusicGen 三个模型，适用于音乐、声音、压缩和生成。它补充说，MusicGen 使用公司拥有且专门授权的音乐进行培训。

三个 AI 模型分别处理声音生成的不同领域。MusicGen 通过文本输入生成音乐。该模型是在「Meta 拥有或专门用于此目的授权的 2 万个小时的音乐」上进行训练的。AudioGen 根据文本提示创建声音效果，如狗叫声或脚步声，它是在公共音效上进行训练的。Meta 改进了 EnCodec 解码器的版本，可以使用户使用较少的伪影来创建声音——当你过多操纵音频时会产生伪影。

艺术家和行业专家对侵犯版权提出了担忧，因为机器学习软件通过识别和复制从网络上抓取的数据中的模式来工作。

Meta 公司让媒体们听了一些使用 AudioCraft 制作的示例音频。口哨声、警笛声和嗡嗡声听起来非常自然。尽管歌曲中的吉他琴弦感觉很真实，但它们仍然感觉有点不自然。

Meta 只是最新处理音乐和 AI 结合的公司之一。今年早些时候，谷歌推出了 MusicLM，这是一个大型语言模型，可以根据文本提示生成几分钟的音乐，只对研究人员开放。然后，一首名为「AI 生成」的歌曲在得到病毒传播后被下架，这首歌曲中有 Drake 和 The Weeknd 的声音。最近，一些音乐家，比如 Grimes，鼓励人们在 AI 创作的歌曲中使用自己的声音。

然而，音乐家们一直在尝试电子音频很长一段时间了；电子舞曲和像 Ultra 这样的音乐节并不是凭空出现的。但是由计算机生成的音乐经常听起来像是从现有音频中处理出来的。AudioCraft 和其他生成式 AI 生成的音乐完全是根据文本和大量的声音数据生成的。

目前，AudioCraft 听起来更像是可以用作电梯音乐或背景歌曲，可以为环境增添氛围，而不是下一个流行热曲。然而，Meta 相信他们的新模型可以像合成器一样开创一波新的流行歌曲潮流，以及合成器在成为流行后如何改变了音乐。

「我们认为 MusicGen 可以变成一种新型乐器——就像合成器首次出现时一样」，该公司在博客中表示。Meta 承认，创建能够创作音乐的 AI 模型的困难，因为音频通常包含数百万个离散点，而不仅仅是像 Llama 2 这样的文本模型，只包含数千个点。

该公司表示，为了使其训练数据的多样性更加丰富，AudioCraft 需要进行开源。

「我们认识到，用于训练我们的模型的数据集缺乏多样性。尤其是用于训练的音乐数据集中，更多是西方风格的音乐，只包含以英文编写的音频文本对和元数据」，Meta 表示。「通过分享 AudioCraft 的代码，我们希望其他研究人员能够更容易地测试限制或消除生成模型中潜在偏见和误用的新方法」。

AudioCraft 开源模型 Gthub 页面：

https://github.com/facebookresearch/audiocraft

（举报）

相关推荐

关键词：

共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

10月28日，AtomGit平台在北京国家会议中心举行升级发布会，正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞，强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源，打造开放中立的基础设施，计划于11月21日正式上线。华为、百度等企业代表分享了开源实践，多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

开源社区人工智能 AtomGit
卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

卖家精灵凭借在跨境电商智能化运营与AI大数据应用领域的领先实力，近日正式加入中国人工智能产业发展联盟（AIIA），成为该国家级AI产业生态重要成员。此次加入标志着其AI技术实力获权威认可，未来将携手联盟推动AI技术研发与产业化，助力中国品牌全球化。依托八年积累的海量电商数据与算法体系，卖家精灵已构建覆盖选品决策、市场分析等全链路AI解决方案，服务超百万跨境卖家，显著提升运营效率与决策精准度。

人工智能跨境电商 AI大数据
人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

科杰科技董事善于洋在2025中国国际数字经济博览会发表演讲，强调高质量数据集是人工智能产业决胜关键。他指出，算力、算法和数据构成AI三大要素，而数据决定模型认知边界与输出可靠性。当前需构建Data&AI一体化平台作为核心基础设施，通过集中管理、分散赋能模式，打通数据采集、治理到AI训练全链路，推动产业智能化升级。该平台已在制造、金融等领域落地，助力企业释放数据要素价值，实现弯道超车。

人工智能数据基础设施数字经济
人工智能巨头OpenAI拟上市估值或高达1万亿美元

OpenAI正积极推进上市计划，据知情人士透露，该公司可能最早于2026年下半年向证券监管机构提交上市申请，目标在2027年正式上市。此次IPO的估值有望达到约1万亿美元，或将跻身全球规模最大的IPO之列。在初步讨论中，OpenAI曾考虑通过上市筹集至少600亿美元资金，实际融资规模可能进一步扩大。

OpenAI IPO 上市计划
厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

10月28日，麒麟信安人工智能孵化器在长沙启动，旨在汇聚AI领域人才、技术与资本，构建开放协同的创新生态。该项目获湖南省多部门支持，已吸引60余个项目入围，组建了首批30余位专家导师团，并与多家顶尖机构共建联合体，通过政策扶持、资本对接等多维度赋能，培育优质AI项目在湘落地发展，助力区域打造人工智能产业创新高地。

人工智能孵化器麒麟信安创新创业
行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

2025年10月，海尔冰箱成为全球首个通过ISO/IEC42001人工智能管理体系认证的家电企业，标志着其AI技术研发与管理达国际领先水平。该认证覆盖语音交互、视觉识别、健康保鲜等核心功能全流程，确保用户数据安全与隐私保护。目前AI系统已应用于博观、麦浪等高端产品，推动智能冰箱行业规范化发展。未来海尔将持续优化AI技术，为用户提供更安全、智能的健康饮食体验。

冰箱品牌人工智能技术海尔冰箱
十方融海小智AI：以科技温度诠释“人工智能+”时代的人文关怀

近日，小女孩“小十三”与十方融海研发的小智AI机器人深情告别的视频走红网络。这段1分17秒的对话不仅让无数网友泪目，更展现了AI技术的情感温度。十方融海团队迅速响应，跨越600公里为女孩送上定制版机器人作为生日礼物，并推出儿童心理陪伴计划。该事件体现了“人工智能+教育”的深刻内涵，彰显科技企业的人文关怀与社会担当，成为“技术向善”的生动实践。
AI日报：阿里夸克“C计划”曝光；Veo3.1将增加视频“精确编辑”功能；Anthropic推出Claude Code网页版

今日AI领域动态：阿里夸克启动"C计划"布局对话式AI应用，剑指字节"豆包"；Anthropic推出Claude Code网页版，支持浏览器直接编码；谷歌Veo新增视频"精确编辑"功能，提升创作效率；Fish Audio升级S1语音克隆模型，10秒即可复刻真人声音；AWS美东故障影响ChatGPT等多项服务；DeepSeek-OCR推出"视觉记忆压缩"机制破解AI记忆瓶颈；Adobe推出AI Foundry服务，支持企业定制品牌AI模型；Anthropic发布Claude for Life Sciences，加速生命科学研究。

AI 对话式AI 阿里巴巴
微算法科技（NASDAQ:MLGO）开发延迟和隐私感知卷积神经网络分布式推理，助力可靠人工智能系统技术

微算科技开发了延迟和隐私感知卷积神经网络分布式推理技术，通过创新队列机制和深度强化学习优化CNN推理过程，结合分布式计算与隐私保护机制，在降低边缘设备计算延迟的同时强化数据隐私。该技术将推理任务智能分配到不同节点，减少数据传输范围，实现高效推理与隐私安全的平衡，为智能医疗、交通等领域提供可靠解决方案。

人工智能深度学习隐私保护
数据智能体 TabTabAI 正式上线，零门槛上手，让 “数据分析” 人人可用

AI数据智能体TabTabAI正式上线，以“零门槛交互+全流程自主处理”为核心优势，打破数据分析技术壁垒。该工具通过自然语言对话，支持多源数据采集、智能处理、深度洞察与可视化，让普通职场人无需编程背景即可完成复杂分析任务。其多智能体协同架构与自动化能力，覆盖从数据收集到决策建议的全链路，助力用户将原始数据高效转化为精准决策依据，真正实现“人人都是数据分析师”。

数据分析数据驱动 AI数据智能体

今日大家都在搜的词：

热文

3 天
7天

Meta 发布利用文本创作音乐的开源 AudioCraft AI：「可能是类比合成器的新型乐器」

共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

人工智能巨头OpenAI拟上市估值或高达1万亿美元

厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

十方融海小智AI：以科技温度诠释“人工智能+”时代的人文关怀

AI日报：阿里夸克“C计划”曝光；Veo3.1将增加视频“精确编辑”功能；Anthropic推出Claude Code网页版

微算法科技（NASDAQ:MLGO）开发延迟和隐私感知卷积神经网络分布式推理，助力可靠人工智能系统技术

数据智能体 TabTabAI 正式上线，零门槛上手，让 “数据分析” 人人可用

今日大家都在搜的词：

热文

iPhone锁屏滑动相机能关闭了苹果iOS 26.1 RC准正式版发布

AI日报：豆包推全自动多人配音系统；Adobe Firefly Image 5重磅

OPPO ColorOS 16正式版推送：首批适配11款机型

AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑

微信升级：支持一次撤回全部消息、删好友能保留聊天记录等功能

鸿蒙智行：全新问界M7上市36天交付破20000台

AI日报：Sora免费额度要缩水；月之暗面发布Kimi Linear架构；C

小米17 Pro系列妙享背屏全新掌机游戏等新功能上线

苹果客服回应iPhone或自动拨号：设置或其他问题

美股4万亿美元市值上市公司已达3家苹果、微软、英伟达组成三巨

站长商机