首页 > 业界 > 关键词  > StabilityAI最新资讯  > 正文

Stability AI发布AI音乐生成工具“Stable Audio” 可生成长达90S音乐

2023-09-20 15:26 · 稿源:站长之家

文章概要:

1. Stability AI发布了一款名为Stable Audio的AI音乐生成工具,它采用潜在扩散技术,能够生成高质量的商业音乐,引起了音乐创作领域的关注。

2. 与其他音乐生成模型不同,Stable Audio能够生成长达90秒的音乐,并且在音乐质量和连贯性方面表现出色。

3. 尽管存在一些潜在法律和道德问题,Stable Audio提供了多种订阅计划,允许用户生成商业音乐,并与音乐库合作分享收益。

站长之家(ChinaZ.com)9月20日 消息:伦敦初创公司Stability AI发布了一款名为Stable Audio的AI音乐生成工具,标志着音乐创作领域再次迎来了创新。Stable Audio采用了一种称为潜在扩散的技术,据称可以生成高质量、商业可用的音乐。

过去的音乐生成模型通常面临音乐质量不高和连贯性不足的问题,但Stable Audio似乎能够解决这些问题。它可以生成长达90秒的音乐,而其他模型通常只能生成几秒钟的音频片段。这一创新是通过潜在扩散技术实现的,该技术类似于Stability AI用于生成图像的stable diffusion技术。Stable Audio的模型可以逐渐减少噪音,从而使音乐更加连贯,符合用户的要求。

image.png

Stability AI与商业音乐库AudioSparx合作,为Stable Audio提供了大约800,000首音乐。这些音乐主要来自独立艺术家,经过筛选以去除了包含深度伪造人声的歌曲。尽管如此,Stability AI表示,Stable Audio主要用于生成器乐,因此不太可能涉及混淆信息和声音伪造的问题。

Stability AI为Stable Audio提供了多种订阅计划,用户可以根据自己的需求选择。付费用户每月支付11.99美元,可以生成高达90秒的商业音乐,而免费用户每月可以生成20个非商业音乐,每个音乐长度为20秒。如果用户希望在拥有超过100,000月活跃用户的应用程序、软件或网站中使用Stable Audio生成的音乐,他们需要签订企业计划。

然而,Stable Audio的发布也引发了一些法律和道德问题。一些音乐制作人和音乐公司担心,这种音乐生成工具可能会导致知识产权纠纷。Stability AI表示,他们正在积极采取措施来确保内容的真实性,包括在图像模型中实施水印技术,以便用户和平台可以识别通过其托管服务生成的AI辅助内容。

Stable Audio具有以下特色点:

  • 人工智能音乐生成:Stable Audio利用人工智能技术,允许用户轻松创作音乐。用户只需描述他们想要的音乐风格或特点,系统即可生成符合描述的音乐。

  • 自定义音乐长度:用户可以根据需要创建自定义长度的音乐,无需担心时长限制。这个功能使得音乐制作更加灵活。

  • 高品质音频:Stable Audio生成并提供高质量的44.1kHz立体声音频,确保音质出色,适合多种用途。

  • 商业用途授权:用户可以将通过稳定音频创建的音乐用于商业项目,包括商业音乐发行和商业产品。不同的许可选项可根据用户的需求进行选择。

  • 5免费试用:Stable Audio提供免费试用,让用户可以在不支付费用的情况下体验其功能。免费试用用户可以生成一定数量的音乐轨道。

  • 不同订阅计划:除了免费试用外,Stable Audio还提供专业版和企业版订阅计划,具备更多的音乐生成次数和时长,适用于不同用户需求。

Stable Audio网址:https://www.stableaudio.com/

举报

  • 相关推荐
  • 数据智能体 TabTabAI 正式上线,零门槛上手,让 “数据分析” 人人可用

    AI数据智能体TabTabAI正式上线,以“零门槛交互+全流程自主处理”为核心优势,打破数据分析技术壁垒。该工具通过自然语言对话,支持多源数据采集、智能处理、深度洞察与可视化,让普通职场人无需编程背景即可完成复杂分析任务。其多智能体协同架构与自动化能力,覆盖从数据收集到决策建议的全链路,助力用户将原始数据高效转化为精准决策依据,真正实现“人人都是数据分析师”。

  • 重磅预告:全链路自主进化 AI 数据分析师 TabTab 将于10月24日上线

    灵快科技推出的AI数据分析师TabTab将于10月24日上线。该产品通过Multi-Agent系统实现全链路自动化数据分析,覆盖数据获取、建模到可视化全流程。用户可用自然语言交互,系统自主规划任务并输出可维护结果,支持Excel、PPT等多种报告格式。核心定位为智能数据分析助手,旨在降低分析门槛,助力企业高效挖掘数据价值,适用于数据分析师、营销人员等各类用户。

  • AI日报:Sora免费额度要缩水;月之暗面发布Kimi Linear架构;Canva免费放出Affinity专业设计套件

    本期AI日报聚焦多项技术突破:OpenAI调整Sora免费额度并推出付费计划,标志视频生成进入商业化;Figma收购Weavy推出AI设计工具;OpenAI发布基于GPT-5的安全研究助手Aardvark;全球首款AI字体生成器Dr Fonts上线;中国信通院发布大模型一体机应用报告;月之暗面推出Kimi Linear架构实现推理速度6倍提升;Canva免费发布Affinity设计套件挑战Adobe;Chrome新增Gemini驱动的图像生成与深度搜索功能。

  • “全球Robotaxi第一股”文远知行:港股上市临近,商业化进程加速

    文远知行通过港交所聆讯,正式进入港股上市冲刺阶段,将构建“美股+港股”双资本平台。作为全球自动驾驶标杆企业,其产品已在7个国家获自动驾驶牌照,在11国30城开展测试运营,安全运营超2200天。技术层面,预测算法误差控制在0.2米内,感知模型延迟小于10毫秒,系统检测精度达99%。成本大幅下降,单车成本降至几十万元,二季度营收同比增长60.8%,自动驾驶网约车业务猛增836.7%。近期获准在北京开展夜间道路测试,向全天候服务网络迈出关键一步。随着技术成熟与商业模式验证,万亿级自动驾驶市场正迎来规模化运营拐点。

  • VITA平台赋能AI办公,沸蛇AI语音鼠标提升办公效率

    云决科技推出VITA一站式AI办公平台,结合自研AI语音鼠标,通过软硬件协同创新提升企业效率。该平台集成DeepSeek等大模型,用户无需切换工具,语音即可调用文字处理、数据分析、创意设计等多元功能,实现会议纪要生成、PPT自动制作、视频一键合成等操作,节省80%工作时间。针对教育、IT、行政等不同行业提供专属解决方案,整合100多个AI应用场景和200多种模板,持续优化产品功能,致力于成为职场人士提升效率的智能助手。

  • iOS 26液态玻璃效果能关了 苹果iOS 26.1 Beta 4新增液态玻璃开关

    苹果公司10月21日向iPhone用户推送iOS 26.1开发者预览版Beta4更新,新增Liquid Glass液态玻璃透明度切换开关,用户可将界面调整为“色调”模式以增强通知可读性。此次更新延续iOS 26的液态玻璃设计语言,带来更沉浸的视觉体验。同时支持关闭锁屏滑动相机功能避免误触,并扩展Apple Intelligence对丹麦语、荷兰语、繁体中文等七种语言的支持,让更多地区用户享受智能服务。

  • 1.3亿美元!LiblibAI拿下国内最大AI应用融资

    2025年AI应用公司LiblibAI完成1.3亿美元B轮融资,由红杉中国等机构领投,创国内AI应用赛道最大单笔融资。该公司通过“工具集成+社区生态”模式,整合图像、视频、3D等多模态能力,覆盖从灵感到成片的完整AI工作流,已孵化超2000万创作者。平台将加速全球化布局,打造多模态内容生态,标志着AI投资正从底层模型转向应用层落地。

  • AI日报:可复刻音色的MiniMax Speech 2.6发布;TikTok推AI剪辑新工具“Smart Split”;Cursor 2.0发布

    本期AI日报聚焦多项技术突破:MiniMax发布低延迟语音合成系统Speech 2.6,实现实时交互;蚂蚁数科与宁波银行打造的金融AI方案入选国际标准;智源推出具身操作能力的Emu3.5多模态模型;Cursor 2.0通过自研模型实现多智能体协同编程;xAI升级Grok新增视频生成功能;OpenAI推出可定制安全模型;TikTok推出AI剪辑工具Smart Split;微软发布强化学习框架Agent Lightning提升大模型训练效率。

  • 科杰科技&甲子光年:2025中国Data&AI数据基础设施白皮书

    当前全球正经历地缘政治重塑与人工智能革命驱动的深刻变革。全球化向区域化演进,供应链加速本土化,AI从前沿技术跃升为核心生产力。麦肯锡研究显示,生成式AI有望为全球经济贡献7万亿美元,中国预计占2万亿美元,接近全球总量三分之一。传统数据系统难以满足AI对实时性、多模态处理和高弹性算力的需求,企业需构建新一代数据基础设施,实现数据生产、治理与AI应用的动态融合,突破"数据烟囱",支持跨场景智能部署。Data&AI一体化将推动数据价值从效率提升向产业协同跃升,成为智能社会的核心引擎。

  • GEO如何改变ChatGPT搜索和Perplexity的游戏规则

    本文对比ChatGPT与Perplexity两大AI搜索平台:ChatGPT作为全能型助手,整合搜索与多任务处理,但存在信息时效性不足;Perplexity专注垂直搜索,强调引用透明与权威来源。针对AI搜索优化(GEO),提出差异化策略:面向ChatGPT需构建结构化知识库、强化品牌实体识别;面向Perplexity需注重权威数据引用和元数据优化。文章还介绍了AIBase的GEO监测工具,通过曝光率等指标量化内容在AI生态中的可见度,并给出可落地的优化行动方案。

今日大家都在搜的词: