音乐界的sd?ACE-Step音乐生成模型发布，20秒打造4分钟完整歌曲

2025-05-07 10:18 · 来源： AIbase基地

ACE-Step，一款由ACE Studio与StepFun联合开发的音乐生成“基础模型”，于近日正式亮相，被誉为“音乐界的Stable Diffusion”。该模型以其惊人的生成速度和多样化功能引发行业热议，支持19种语言，可在短短20秒内生成一首长达4分钟的完整音乐作品，效率比主流模型快15倍以上。

核心功能亮点:从歌词到完整歌曲一气呵成

ACE-Step以其强大的生成能力重新定义了AI音乐创作。其核心功能包括:

歌词驱动创作:输入歌词，模型自动生成旋律并演唱完整歌曲;

风格化编曲:根据指定的风格标签（如说唱、电子乐、流行等），自动生成伴奏和配器;

精准修改:支持对歌曲某段歌词进行修改，而不影响原有旋律的连贯性;

多样化生成:能够生成带风格的说唱、电子乐、人声或复杂配器，满足不同音乐场景需求。

社交媒体上，开发者与音乐创作者对ACE-Step的“一句歌词快速写歌”功能赞不绝口，认为其为音乐创作提供了前所未有的便捷性与灵活性。

技术突破:高效生成与多语言支持

ACE-Step基于DiT（Diffusion Transformer）架构，采用轻量化设计，支持在消费级GPU上运行，显著降低了硬件门槛。在A100GPU上，模型仅需20秒即可生成4分钟的高质量音乐，生成速度比传统模型快15倍以上。此外，ACE-Step支持19种语言，覆盖英语、中文、日语、西班牙语等多种语系，为全球音乐创作者提供了广泛的适用性。AIbase编辑团队了解到，该模型通过与StepFun的Step-1(130亿参数语言模型)结合，经过音频上下文预训练和任务特定后训练，实现了跨模态音乐理解与生成的高效融合。

开源赋能，社区驱动创新

作为一款开源模型，ACE-Step通过GitHub（stepfun-ai/Step-Audio）向开发者开放，允许社区对其进行微调以适配多样化的音乐任务。ACE Studio与StepFun表示，ACE-Step的简单架构和低硬件要求使其易于扩展，未来有望支持更多音乐风格和创作场景。AIbase观察到，社区开发者已开始基于ACE-Step开发定制化的音乐生成工具，进一步推动了AI音乐生态的繁荣。

AI音乐创作的未来标杆

ACE-Step的发布不仅展示了ACE Studio与StepFun在AI音乐生成领域的深厚技术积累，也为全球音乐创作者提供了一个高效、灵活的创作平台。AIbase编辑团队认为，ACE-Step的快速生成能力和多语言支持将大幅降低音乐创作的门槛，助力音乐家、独立创作者乃至影视制作团队实现创意落地。未来，随着模型的迭代和社区的持续贡献，ACE-Step有望成为AI音乐创作领域的标杆，引领“人机共创”的新潮流。

项目地址：https://ace-step.github.io/

相关推荐

如何用豆包音乐生成功能创作AI歌曲？

本文介绍如何利用豆包AI工具进行音乐创作。用户可通过APP或网页端(https://www.doubao.com/chat)使用该功能，按照固定句式输入创作需求：包括歌曲主题、音乐风格(如民谣、流行)、表达情绪(快乐、怀旧等)及音色选择(男声/女声)。系统会根据指令自动生成歌词并配乐，用户可即时查看歌词内容和播放生成的音乐。操作流程简单：打开豆包→选择音乐生成功能→填写创作指令→提交等

音乐创作 AI工具灵感激发
小白如何用海绵音乐生成AI音乐？

本教程介绍如何利用AI音乐生成工具"海绵音乐"零基础创作个性化音乐。通过输入情绪(治愈/欢快)、乐器(钢琴/吉他)、节奏(慢/中/快)等关键词，AI可快速生成适合短视频配乐、背景音乐等场景的原创音乐。操作流程简单：注册账号→输入关键词→生成试听→下载使用。关键技巧包括使用具体关键词组合、多次调整优化。注意商用需确认版权，部分功能需付费。该工具让音

AI音乐生成短视频配乐背景音乐制作
全球首款生成式人形机器人运动大模型发布：可根据指令生成跑步、舞蹈等连贯动作

今日上午，国家地方共建人形机器人创新中心联合复旦大学未来信息创新学院，正式发布了全球首款生成式人形机器人运动大模型龙跃”（MindLoongGPT）。龙跃大模型以自然语言驱动”为核心，构建了从多模态输入到高保真动作生成的完整闭环，颠覆传统运动控制范式。也就是说，用户无需学习专业术语或操作复杂软件，仅需像与人类对话一样发出指令，例如以优雅的姿势递

人形机器人生成式模型运动控制
荐AI日报：MiniMax推视频生成模型Hailuo 02；Cursor Pro取消500次请求限制；谷歌发布AI模型 Gemini 2.5 Flash-Lite

本文汇总了AI领域最新动态：1)Cursor Pro取消500次请求限制；2)稀宇科技推出视频生成模型Hailuo02；3)谷歌发布轻量级AI模型Gemini2.5Flash-Lite；4)科大讯飞星火X1升级版7月上线；5)腾讯元宝推出AI编程模式；6)OpenAI将下架GPT-4.5 API；7)苹果Speech API转录速度超Whisper 55%；8)百度推出数字人互动直播间；9)Meta曾试图高薪挖角OpenAI人才；10)Krea1公测开放，解决"AI感"问题；11)特斯拉Grok车载AI助手即将上线；12)谷歌Gemini新增视频分析功能。

人工智能开发者技术趋势
网易云音乐iPad端新版beta上线打造无广告纯净音乐体验

网易云音乐宣布其iPad端产品迎来重大更新，新版（beta）正式登陆应用市场，为用户带来了一系列升级与改进。此次更新，网易云音乐继续秉持“听劝”态度，深度响应用户需求，致力于打造更加优质、纯净的音乐聆听环境。在产品功能、界面设计以及iPad系统适配方面，网易云音乐均进行了全面优化。新版iPad端特别推出了无广告纯净版，让用户在享受音乐的同时，免受广告�

网易云音乐 iPad端更新音乐聆听体验
荐AI日报：Midjourney重磅推出视频生成模型V1；OpenAI将在今年夏季发布GPT-5；谷歌推Search Live语音搜索功能

本期AI日报聚焦多项AI领域重要进展：1) Midjourney推出首款视频生成模型V1，支持21秒视频生成；2) OpenAI CEO确认GPT-5将于今夏发布；3) Google上线语音对话搜索功能Search Live；4) OpenAI开源客户服务代理框架；5) MiniMax发布智能代理Agent；6) 恶意工具WormGPT出现新变种；7) OpenAI推出企业版ChatGPT折扣；8) DeepSite V2支持3D网页动画生成；9) AI工具可秒变PPT；10) 比亚迪与字节跳动合作开发动力电池技术；11) 马斯克否认xAI巨额亏损传闻。

AI日报 Midjourney 视频生成模型
一加Ace 5至尊版发布：国补后售价2124.15元起

一加正式推出Ace5至臻版手机，主打电竞性能与亲民价格。配备6.83英寸1.5K直屏，搭载天玑9400处理器，安兔兔跑分突破322万。首创电竞三芯技术（天玑9400+灵犀触控芯+电竞Wi-Fi芯片G1），并首次将游戏内核写入天玑平台。提供12GB+256GB至16GB+1TB五种存储组合，售价2124元起。影像方面配备5000万主摄+800万超广角，内置6700mAh电池支持100W快充。创新采用3840Hz超高频PWM调光+硬件级低蓝光技术，兼顾显示效果与护眼需求。Wi-Fi连接方面首创电竞Wi-Fi芯片G1，配合超级Wi-Fi3.0技术提升信号稳定性。

一加Ace5 手机发布性能配置
如何用网易天音 AI 快速生成背景音乐？

网易天音是一款AI音乐生成工具，专为美食、生活类短视频提供定制背景音乐。用户无需专业账号，通过场景标签或文字描述即可快速生成适配音乐。操作流程：1.进入官网或App点击"开始创作"；2.输入关键词（如"蛙声、稻花"）或具体需求描述；3.AI自动生成音乐并试听筛选；4.下载MP3格式文件。支持中文指令识别，能自动匹配场景风格（轻快钢琴、电子音效等）�
快手可灵AI上线2.1系列模型：生成5秒视频不到1分钟

快手旗下可灵AI发布2.1系列模型，包含720p标准版和1080p高品质版，在性价比、生成速度和质量三大维度实现突破。新模型生成5秒视频仅需20-35灵感值，与上代保持相同成本；1080p视频生成时间不到1分钟，快于行业同级产品2-3倍。模型在动态表现、物理模拟和语义理解方面均有优化，人物动作更真实自然。可灵AI自发布以来发展迅猛，全球用户突破2200万，月活增长25倍，累计生成1.68亿视频和3.44亿图片。商业化进程加速，2025年Q1营收超1.5亿元人民币，展现强劲市场潜力。

可灵AI 可灵2.1 AI视频创作
Anthropic 发布 Claude 4 系列 AI 模型，有啥重大突破?

Anthropic 表示，这两款 AI 模型在多个行业基准测试中表现出色，是目前业内最强的模型之一……

AI大模型 Claude4大模型能连续工作7小时 Claude4

今日大家都在搜的词：

热文

3 天
7天

音乐界的sd?ACE-Step音乐生成模型发布，20秒打造4分钟完整歌曲

如何用豆包音乐生成功能创作AI歌曲？

小白如何用海绵音乐生成AI音乐？

全球首款生成式人形机器人运动大模型发布：可根据指令生成跑步、舞蹈等连贯动作

荐AI日报：MiniMax推视频生成模型Hailuo 02；Cursor Pro取消500次请求限制；谷歌发布AI模型 Gemini 2.5 Flash-Lite

网易云音乐iPad端新版beta上线打造无广告纯净音乐体验

荐AI日报：Midjourney重磅推出视频生成模型V1；OpenAI将在今年夏季发布GPT-5；谷歌推Search Live语音搜索功能

一加Ace 5至尊版发布：国补后售价2124.15元起

如何用网易天音 AI 快速生成背景音乐？

快手可灵AI上线2.1系列模型：生成5秒视频不到1分钟

Anthropic 发布 Claude 4 系列 AI 模型，有啥重大突破?

今日大家都在搜的词：

热文

刘强东点外卖给骑手1000元小费：此前达达已完成私有化

字节小米位列中国全球化品牌前二中国全球化品牌50强出炉

SpaceX回应星舰爆炸：无人员伤亡及周边危害

京东618战报公布：订单破22亿单下单用户同比增加超100%

孟羽童回应一手好牌打得稀烂：不纠结过去

刘强东点外卖给骑手1000元小费：此前达达已完成私有化

小米618全渠道累计支付金额破355亿元：刷新历年大促纪录

字节小米位列中国全球化品牌前二中国全球化品牌50强出炉

SpaceX回应星舰爆炸：无人员伤亡及周边危害

理想i8已到最后筹备阶段将于7月下旬发布

站长商机