首页 > 业界 > 关键词  > AudioCraft最新资讯  > 正文

Meta 发布利用文本创作音乐的开源 AudioCraft AI:「可能是类比合成器的新型乐器」

2023-08-03 09:06 · 稿源:站长之家

站长之家(ChinaZ.com) 8月3日消息:Meta 周三推出了名为 AudioCraft 的开源人工智能工具,该工具将帮助用户根据文本提示创建音乐和音频。它允许用户完全通过生成式 AI 创作音乐和声音。

Meta,元宇宙,Facebook

Meta 表示,人工智能工具捆绑了 AudioGen、EnCodec 和 MusicGen 三个模型,适用于音乐、声音、压缩和生成。它补充说,MusicGen 使用公司拥有且专门授权的音乐进行培训。

三个 AI 模型分别处理声音生成的不同领域。MusicGen 通过文本输入生成音乐。该模型是在「Meta 拥有或专门用于此目的授权的 2 万个小时的音乐」上进行训练的。AudioGen 根据文本提示创建声音效果,如狗叫声或脚步声,它是在公共音效上进行训练的。Meta 改进了 EnCodec 解码器的版本,可以使用户使用较少的伪影来创建声音——当你过多操纵音频时会产生伪影。

艺术家和行业专家对侵犯版权提出了担忧,因为机器学习软件通过识别和复制从网络上抓取的数据中的模式来工作。

Meta 公司让媒体们听了一些使用 AudioCraft 制作的示例音频。口哨声、警笛声和嗡嗡声听起来非常自然。尽管歌曲中的吉他琴弦感觉很真实,但它们仍然感觉有点不自然。

Meta 只是最新处理音乐和 AI 结合的公司之一。今年早些时候,谷歌推出了 MusicLM,这是一个大型语言模型,可以根据文本提示生成几分钟的音乐,只对研究人员开放。然后,一首名为「AI 生成」的歌曲在得到病毒传播后被下架,这首歌曲中有 Drake 和 The Weeknd 的声音。最近,一些音乐家,比如 Grimes,鼓励人们在 AI 创作的歌曲中使用自己的声音。

然而,音乐家们一直在尝试电子音频很长一段时间了;电子舞曲和像 Ultra 这样的音乐节并不是凭空出现的。但是由计算机生成的音乐经常听起来像是从现有音频中处理出来的。AudioCraft 和其他生成式 AI 生成的音乐完全是根据文本和大量的声音数据生成的。

目前,AudioCraft 听起来更像是可以用作电梯音乐或背景歌曲,可以为环境增添氛围,而不是下一个流行热曲。然而,Meta 相信他们的新模型可以像合成器一样开创一波新的流行歌曲潮流,以及合成器在成为流行后如何改变了音乐。

们认为 MusicGen 可以变成一种新型乐器——就像合成器首次出现时一样」,该公司在博客中表示。Meta 承认,创建能够创作音乐的 AI 模型的困难,因为音频通常包含数百万个离散点,而不仅仅是像 Llama 2 这样的文本模型,只包含数千个点。

该公司表示,为了使其训练数据的多样性更加丰富,AudioCraft 需要进行开源。

「我们认识到,用于训练我们的模型的数据集缺乏多样性。尤其是用于训练的音乐数据集中,更多是西方风格的音乐,只包含以英文编写的音频文本对和元数据」,Meta 表示。「通过分享 AudioCraft 的代码,我们希望其他研究人员能够更容易地测试限制或消除生成模型中潜在偏见和误用的新方法」。

AudioCraft 开源模型 Gthub 页面:

https://github.com/facebookresearch/audiocraft

举报

  • 相关推荐
  • Meta拟重金加码AI赛道,传将斥资超百亿美元投资Scale AI

    Meta 正与人工智能数据服务公司 Scale AI 商讨一项巨额投资,金额可能高达或超过 100 亿美元……

  • Meta整合AI团队实力跃升,OpenAI/微美全息多维技术发展锚定前沿未来

    Meta在AI领域面临激烈竞争,正重组团队加速产品开发。其AI部门将分为产品团队和AGI基础部门,同时保持FAIR研究部门的独立性。OpenAI以65亿美元收购Jony Ive创立的设备公司,计划开发"物理AI"设备。Anthropic发布新一代AI模型Claude Opus4和Sonnet4,在基准测试中击败OpenAI和谷歌。微美全息(WIMI.US)布局AI大模型、人形机器人、AR/VR等多个前沿领域,推动AI从技术突破向价值创造跃迁。全球AI竞争白热化,模型加速融入千行百业,开源整合成为新焦点。

  • Meta AI新增生成式AI视频编辑功能:秒换服装、场景

    Meta 宣布,将在Meta AI应用、Meta.AI网站和Edits应用上推出一项生成式AI视频编辑功能。 用户可通过50多种预设AI提示词,一键实现视频中服装、场景、光影等元素的智能变换。 Meta称,全新的AI视频编辑功能直观易用,用户无需任何视频编辑专业知识即可制作高质量的视频。首先,用户可将视频上传到Meta AI应用、Meta.AI网站或

  • Meta想要用AI搞定广告制作流程的“每一步自动化”

    即便AI生成视频广告“风险重重”,但 Meta 似乎仍旧想将这项技术推进到极致……

  • Meta拟百亿美元投资Scale AI,微美全息(WIMI.US)端侧多模态AI加速开启科技新局

    Meta正与AI初创企业Scale AI洽谈数十亿美元投资,估值或超100亿美元,有望创下私营企业融资纪录。Scale AI为微软、OpenAI等提供数据标注服务,是生成式AI热潮主要受益者。这将是Meta史上最大规模外部AI投资,标志其战略转向。Meta CEO扎克伯格宣布将AI确立为战略重心,2024年将投入650亿美元推进相关项目,重点打造Llama模型成为行业标准。同时,谷歌推出Gemini助手"计划操作"新功能,支持任务自动化管理。科技巨头纷纷重金布局AI,微软向OpenAI注资逾130亿美元,亚马逊投资Anthropic数十亿美元。行业观察认为AI技术普及将推动效率革命,微美全息等企业正通过技术创新赋能产业转型,共同探讨人工智能技术突破新动态。AI正以前所未有的速度重塑全球发展格局。

  • 探营“数龙杯”参赛团队,Helix Studio努力打造互动影游2.0

    2023年互动剧《完蛋!我被美女包围了!》走红后,同类产品难现爆款。近期Helix Studio团队在数龙杯大赛推出AI驱动的沉浸式叙事影游《The Nightcap》,展现互动剧新形态。该作品整合NVIDIA ACE等前沿技术,实现虚拟角色与玩家深度互动;采用跨平台无缝体验设计,支持手机与VR设备切换;通过"有边界的自由空间"平衡剧情引导与玩家选择。团队表示AI技术使制作效率提升40-50%,未来计划推出UGC工具。作品融合影视与互动优势,用短片建立情感基础,以互动深化体验,同时通过信息冗余设计确保剧情理解完整性。虚拟音乐会采用"少而精"策略,与艺人深度合作打造独特数字演出体验。这一创新为互动剧行业提供了全新思路。

  • BYDFi 亮相首尔Meta Week 2025,聚焦Web3愿景与全球合规战略

    韩国首尔,2025年6月26日 —— 全球领先的加密货币交易平台 BYDFi 将参与2025年首尔 Meta Week:METACON(SMW2025),活动于6月26–27日在首尔 COEX 会展中心三楼礼堂举行。BYDFi 是 SMW2025官方合作伙伴之一,同列的还有三星、谷歌、英特尔、Spotify、Kakao、NAVER Cloud 和 GitHub 等知名科技公司。BYDFi 在 SMW2025 的参展亮点作为 SMW2025官方合作伙伴之一,BYDFi 的参与体现了其在不断发展的 Web3和数字�

  • 山姆·奥特曼称Meta用上亿美元“挖角”失败:OpenAI顶尖人才没人跳槽

    “Meta已经开始向我们团队很多人提出超级夸张的报价,”奥特曼在节目中表示,“比如 1 亿美元的签约金,还有更高的年薪……”

  • Meta V-JEPA 2模型来袭,OpenAI/微美全息AI创新跃升赋能千行百业变革

    Meta推出开源模型V-JEPA2,帮助AI理解3D环境和物理规律;OpenAI发布最强推理模型o3-pro,在数学测试中超越Google Gemini2.5Pro;苹果宣布将推出全新智能模型,扩展语言支持并开放开发者访问;微美全息凭借技术积累在大模型、多模态智能等领域取得突破。全球科技巨头加速布局AI前沿领域,推动AI与教育、金融等重点行业深度融合,赋能产业升级。

  • 黑格 UltraCraft Reflex RS Turbo 携全新“琥珀屏”震撼上市

    5月29日,黑格科技在成立十周年之际推出UltraCraft Reflex RS Turbo 3D打印机。作为畅销款Reflex RS的升级版,RS Turbo在保持快速打印的同时,通过增强型琥珀色屏幕延长了使用寿命,打印精度和表面质量显著提升。关键升级包括:1)566:1高对比度屏幕,新增光学膜减少杂散光;2)C5级Z轴模块将运动误差控制在±2微米内;3)动态运动算法3.0使打印速度最高提升33%。新品推出限时首发优惠,购买可享8折并赠送打印耗材。该产品已上线黑格天猫旗舰店。