首页 > 业界 > 关键词  > StableAudio最新资讯  > 正文

Stability AI发布AI音乐生成工具Stable Audio

2023-09-14 10:10 · 稿源:站长之家

要点:

  • 位于伦敦的初创公司Stability AI推出了Stable Audio,这是一个使用人工智能从简单的文本输入生成自定义音乐曲目和音效的工具,具备在较长时间内生成专业音频的能力。

  • Stable Audio的优势在于其能够以多种流派生成音乐作品,提供用户友好的基于浏览器的界面,面向需要快速背景音乐的创意专业人士。

  • 该系统在由AudioSparx提供的大型音乐库上进行了训练,而在训练中使用的歌曲的创作者则通过AudioSparx分享了Stable Audio的利润,尽管仍存在有关潜在内容抄袭和版权问题的担忧。

站长之家(ChinaZ.com)9月14日 消息:总部位于伦敦的初创公司 Stability AI 于周三推出了一款名为 Stable Audio 的新产品,该产品利用人工智能生成定制音乐曲目和音效。

Stable Audio 使用一种基于扩散的 AI 模型,可以在几秒钟内从简单的文本输入生成定制音频文件。用户可以指定音乐风格、乐器、音调和其他特征,系统然后自动创作出相匹配的歌曲、音效或乐器声部。

Stability AI 使用输入文本进行了测试,如“后摇滚、吉他、鼓套、低音、弦乐、欢快、振奋、情绪化、流畅、原始、史诗、多愁善感、125BPM”。结果是一首快速的大气摇滚歌曲,BPM 为125。根据 Stability 的说法,这表明 Stable Audio 可以生成多种风格的歌曲,包括氛围音乐、技术音乐和电子舞曲。

image.png

与以往基于人工智能的音乐生成器不同,Stable Audio 似乎能够以长达90秒的时间生成音乐上连贯的作品,并且以44.1kHz 的专业音频质量。

生成的样本音频听起来非常真实,几乎不会让人怀疑背后没有人类作曲家。根据 Stability AI 的说法,使用 Nvidia A100GPU,95秒音频可以在不到一秒钟内生成。

image.png

这种技术有潜力在各种应用中发挥作用,特别是在电影制作和游戏开发等创意领域。通过网络浏览器可以访问,即使对人工智能不熟悉的用户也能轻松使用。

为了实现这种质量,Stability AI 对音乐库进行了培训,音乐库由 AudioSparx 提供。通过使用约80万首歌曲、音效和乐器片段,AudioSparx 与 Stability AI 合作,并承诺将音乐库的收入份额提供给初创公司 Stability Audio。作为回报,参与培训的歌曲的创作者可以通过 AudioSparx 分享 Stable Audio 的利润。

据称,在培训之前,这些创作人被问及是否愿意提供他们的歌曲。这个决定可能是对 Stability 在 Stable Diffusion 的培训素材涉及版权辩论中所面临的大规模反对的回应。

根据 Stability AI 的说法,用户可以免费将使用 Stable Audio 创建的音轨用于个人用途。商业用途需要付费订阅。该公司的目标是创意专业人士,如电影制片人或游戏开发人员,他们需要快速获得合适的背景音乐。

Stability AI 还计划发布一个基于不同数据集训练的开源音乐模型。

Stable Audio 不同于 Stable Diffusion,因为它不是开源的,不像流行的图像模型那样。然而,FAQ 中表示,将很快发布一个基于其他数据集训练的开源模型。

Stable Audio 的基础是文本到音乐的模型 Dance Diffusion,该模型是在2022年由 Harmonai 发布的,并得到了 Stability 的支持。然而,Stable Audio 是 Stability AI 音频部门从零开始开发的模型,该部门成立于2022年4月。

对音乐使用扩散模型并不是一个新的想法。然而,Stable Audio 的强大之处在于它能够以不同长度生成作品,训练过程中考虑到了这一点。

Stability AI 是这样解释底层技术的:

  • Stable Audio 是一个潜在扩散模型,由几个部分组成:变分自动编码器 (VAE)、文本编码器和基于 U-net 的扩散模型。
  • VAE 将立体声音频压缩为有损、抗噪声和可逆的潜在编码,从而实现更快的生成和训练。
  • 新训练的 CLAP 模型的冻结文本编码器用于文本提示。
  • 定时嵌入在训练期间计算并用于控制输出音频长度。
  • Stable Audio 的扩散模型是基于 Moûsai 模型的9.07亿参数 U 网。

您可以通过最近推出的网络界面专门使用稳定音频。每月有20首时长不超过45秒的歌曲免费供个人使用。每月只需11.99美元,即可获得500首歌曲,播放时间长达90秒,并获得商业许可。

没有内容过滤器很容易导致抄袭

该工具还可以用来伪造流行艺术家的歌曲。到目前为止,唱片公司已经能够成功地对抗此类人工智能创作,但法律状况仍不清楚。

Stability AI 本身在接受 Techcrunch 采访时坚称,它希望负责任地使用该技术。AudioSparx 的数据库不包含流行歌曲,但许多歌曲都以知名艺术家的风格进行标记。与谷歌的 MusicLM不同,著名艺术家的名字不会被屏蔽,至少目前还没有。

Stable Audio 能否为 Stability AI 的商业模式带来回报还有待观察,该商业模式迄今为止一直处于亏损状态。无论如何,人工智能作品的令人印象深刻的质量让你刮目相看。

举报

  • 相关推荐
  • 我的Tarotap AI塔罗占卜深入使用体验分享

    作为一名喜欢探索内心世界、对灵性和塔罗有着浓厚兴趣的人,我平时就很喜欢去一些塔罗线下店找占卜师们占卜和交流。今年偶然之间,我在朋友的介绍下了解到一个名为[Tarotap]的AI塔罗占卜网站。希望你和我一样,在这个平台获得更多自我探索的机会,体验AI塔罗带来的惊喜,更愿你能在塔罗的智慧中,遇见更辽阔的自己。

  • 苹果将发布Studio Display 2显示器:5K Mini LED屏

    据报道,苹果正在开发StudioDisplay2显示器,将升级至MiniLED屏幕,预计在今年年底上市。这款即将面世的新品沿用了LG供应的27英寸高质量面板,分辨率维持在细腻的5K级别。相较于StudioDisplay当前采用的传统LED背光设计,MiniLED显示更加细腻清晰。

  • 靠着ToB没做成的功能,美图BeautyCam登顶东南亚多国下载总榜?

    美图旗下的AppBeautyCam陆续登顶了泰国、越南、新加坡、马来西亚等几个东南亚市场的应用商店下载总榜。BeautyCam在东南亚最大市场的印尼,也登顶了GooglePlay下载总榜,至今已持续了7天之久。写在最后2月10日,美图发布2024全年业绩预增公告,按非国际财务报告准则,2024年度经调整后归属于母公司权益持有人净利润同比增长约52%至60%,我们之前分析过美图2024年上半年财报,看来

  • 苹果AI中文版终于来了:iOS 18.4 Beta 3上线

    苹果面向开发者推送了iOS18.4Beta3版本,新版iOS加入了苹果AI中文版。在iOS18.4Beta3上,AppleIntelligence适配了多种语言,包括法语、德语、意大利语、葡萄牙语、西班牙语、日语、韩语和简体中文。目前英语版本的AppleIntelligence已经上线,主要功能包括用于总结和校对文本的写作工具、信息和邮件应用中的建议回复、通知摘要以及图像识别、照片擦除、视频剪辑、文本检索、录音转写等。

  • 苹果公司发布新款Mac Studio 搭载M3 Ultra芯片

    苹果公司于近日在其官方网站上正式推出了全新的MacStudio产品。此次发布的MacStudio包括两个版本,分别是M4Max版本和M3Ultra版本,满足不同用户的需求。这一新产品的发布,无疑将进一步丰富苹果的产品线,为用户提供更多选择。

  • 苹果Mac Studio发布:16499元起

    苹果MacStudio正式上架苹果官网,M4Max版本定价是16499元,M3Ultra版本定价是32999元,3月7日上午9点接受预购,3月12日发售。MacStudioM4Max版包含14核中央处理器、32核图形处理器以及16核神经网络引擎,正面配备两个USB-C端口,一个SDXC卡插槽,背面配备四个雷雳5端口,两个USB-A端口,一个HDMI端口,一个10Gb以太网端口,一个耳机插孔,支持外接最多达五台显示器。M3Ultra版MacStudio包含28核中央处理器、60核图形处理器以及32核神经网络引擎,正面配备两个雷雳5端口,一个SDXC卡插槽;背面配备四个雷雳5端口,两个USB-A端口,一个HDMI端口,一个10Gb以太网端口,一个耳机插孔,支持外接最多达八台显示器。

  • 最新Mac Studio用的还是上代M3 Ultra:苹果给出解释

    今天苹果更新了MacStudio,但其高端型号搭载的仍是上一代的M3Ultra芯片非最新的M4Ultra,这也引发了不少猜测。对此苹果向ArsTechnica解释称:并不是每一代Mac的M系列芯片都会包含Ultra版本”。M3Ultra还支持120Gbps的雷电5接口,并可扩展至512GB内存。

  • 喜迎开学季 用三星Galaxy Tab S10系列解锁AI畅学体验

    伴随着晴和的春意,新学期的生活正向我们奔来。在这样一个万象更新的时刻,我们也应该用更高效的学习新方法来沉着应对新学期的新挑战。更别提随着“国补”政策的落实,购买三星GalaxyTabS10/TabS9/TabS9/TabS9FE/TabS9FE/TabA9六款型号的智能平板电脑,即有机会享受至高500元的15%购新补贴,现在购机即可立享超值福利!

  • 阿里云PolarDB重磅发布云原生与Data+AI新特性,打造智能时代数据引擎

    2月26日,在2025阿里云PolarDB开发者大会上,云原生数据库PolarDB正式推出内置大模型的PolarDBAI版本,帮助个人和企业开发者快速部署并上线AI应用。PolarDBAI节点采用模型算子化形态,支持用户在数据库内部直接进行搜索推理优化,在线推理吞吐量可提升10倍以上,显著降低用户部署成本。作为中国首款自研云原生数据库,阿里云PolarDB已规模化应用于政务、金融、电信、物流、互联

  • 10万多元的苹果Mac Studio发货延迟:配置史无前例

    苹果官网显示,配备512GB统一内存的MacStudio发货延期,预计送达日期是3月26日-3月29日。如果用户选配96GB或者256GB统一内存,发货时间比512GB版本要早约一周时间,预计送达日期是3月20日-3月22日。M3Ultra芯片可选配最多80核图形处理器,并支持最高512GB统一内存,与M4Pro和M4Max芯片一样,M3Ultra芯片也集成了雷雳5技术支持。