首页 > AI头条  > 正文

开源版Suno来了!AI音乐生成模型YuE可生成专业级的歌声和伴奏

2025-03-28 15:06 · 来源: AIbase基地

近日,由香港科技大学与音乐领域的 DeepSeek 合作开发的开源音乐生成模型 YuE 正式发布,震惊了不少乐迷和音乐创作者。这一模型不仅能够生成多种风格的音乐,还可以模拟人声,给听众带来全新的音乐体验。

YuE 的特点在于其双 LLaMA 语言模型架构,这使其能够无缝适配各种大语言模型,并且能够处理长达5分钟的完整歌曲。这一创新的设计让 YuE 在音乐生成的质量上达到了前所未有的高度,甚至与市场上著名的闭源音乐生成工具 Suno 和 Udio 相抗衡。YuE 可以同时生成专业级的歌声和伴奏,实现了音乐创作的端到端生成。

image.png

研究团队在 YuE 中引入了 “双轨版下一 token 预测” 策略,将人声和伴奏轨道分开建模,确保了音乐创作中的细腻度和一致性。这一方法不仅提升了音质,还显著减少了内容重构过程中的信息损失。此外,YuE 的 “结构化渐进生成” 技术让歌曲的主副歌段落能够在同一上下文中交替进行,进一步提高了歌曲的连贯性。

为了避免抄袭,YuE 还开发了独特的音乐上下文学习技术,这让模型在创作时能够从已有的音乐片段中学习而不重复。这一创新不仅提高了模型的音乐性,还增强了其创作的独特性。最终,YuE 在多项评测中展现出卓越的表现,成功赢得了用户的好评。

随着 YuE 的发布,音乐创作的未来将更加充满可能性。无论你是专业音乐人还是业余爱好者,都可以在这个平台上体验 AI 带来的音乐创作乐趣。

项目地址:https://github.com/multimodal-art-projection/YuE

  • 相关推荐
  • 小白如何用海绵音乐生成AI音乐?

    本教程介绍如何利用AI音乐生成工具"海绵音乐"零基础创作个性化音乐。通过输入情绪(治愈/欢快)、乐器(钢琴/吉他)、节奏(慢/中/快)等关键词,AI可快速生成适合短视频配乐、背景音乐等场景的原创音乐。操作流程简单:注册账号→输入关键词→生成试听→下载使用。关键技巧包括使用具体关键词组合、多次调整优化。注意商用需确认版权,部分功能需付费。该工具让音

  • 如何用豆包音乐生成功能创作AI歌曲?

    本文介绍如何利用豆包AI工具进行音乐创作。用户可通过APP或网页端(https://www.doubao.com/chat)使用该功能,按照固定句式输入创作需求:包括歌曲主题、音乐风格(如民谣、流行)、表达情绪(快乐、怀旧等)及音色选择(男声/女声)。系统会根据指令自动生成歌词并配乐,用户可即时查看歌词内容和播放生成的音乐。操作流程简单:打开豆包→选择音乐生成功能→填写创作指令→提交等

  • 京东云升级JoyAgent 2.0:分钟级生成企业级专业数字员工

    京东云在上海发布九大AI产品,包括JoyAgent智能体2.0、JoyBuild大模型开发平台等,助力企业重构AI基础设施。京东集团技术委员会主席曹鹏表示,数字员工上岗率将成为衡量企业先进性的标准。JoyAgent 2.0具备三大核心能力:主动分析执行、丰富工具链和多智能体协同,已在研发、政务服务等场景深度应用。目前京东内部智能体数量超14000个,覆盖零售、物流等多个领域,显著提升工作效率。该平台还接入数十个大模型,提供100多个行业解决方案模板,支持企业快速构建专属智能体。

  • 如何用网易天音 AI 快速生成背景音乐?

    网易天音是一款AI音乐生成工具,专为美食、生活类短视频提供定制背景音乐。用户无需专业账号,通过场景标签或文字描述即可快速生成适配音乐。操作流程:1.进入官网或App点击"开始创作";2.输入关键词(如"蛙声、稻花")或具体需求描述;3.AI自动生成音乐并试听筛选;4.下载MP3格式文件。支持中文指令识别,能自动匹配场景风格(轻快钢琴、电子音效等)�

  • 豆包大模型1.6发布:全球第一梯队!可生成1080p高品质视频

    字节跳动旗下豆包大模型正式升级为1.6版,在推理、数学、指令遵循、Agent等方面的能力均有较大提升,同时豆包视频生成模型Seedance 1.0 pro、豆包语音播客模型也正式发布。 豆包大模型1.6包括三部分,分别是豆包1.6、豆包1.6-thinking、豆包1.6-flash。 其中,豆包1.6支持on/off/auto三种思考模式,豆包1.6-thinking强化了思考能力,支持多模态,在多个权威测评集上达到了全球第一梯队�

  • AI日报:QQ浏览器升级为AI浏览器;OpenAI全新编程智能体Codex;B站团队推动漫视频生成模型AniSora

    本文介绍了AI领域多项最新进展:1)B站团队推出开源动漫视频生成模型AniSora,支持多种风格创作;2)OpenAI发布编程智能体Codex,提升开发效率;3)Google测试AI问答功能AI Mode;4)ChatGPT将整合MCP协议,支持第三方AI服务对接;5)阿里推出ZeroSearch框架,减少对搜索引擎的依赖;6)Stability AI与Arm合作推出手机端音频生成AI;7)Qwen发布WorldPM系列大模型;8)GPT-5将整合多款产品功能;9)ListenHub上线AI播客生成工具;10)QQ浏览器升级为AI浏览器;11)数学建模AI助手MathModelAgent面世;12)GenSpark推出全球首个智能下载代理;13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

  • 告别普通U盘!专业级雷克沙C50V行车记录U盘实测解析

    雷克沙推出专为新能源汽车设计的JumpDrive C50V行车记录专用U盘,采用Type-C接口,体积比传统U盘缩小50%以上。该产品具备专业级性能:支持USB 3.2 Gen1标准,最高读取速度200MB/s;128GB/256GB版本持续写入速度达70MB/s,确保4K视频稳定录制。采用原厂TLC颗粒,优化后支持10000小时以上持续读写,适应-40℃至85℃极端温度。特有哨兵模式可在碰撞时自动锁定关键视频。产品已获部分车企采用,提供64GB/128GB/256GB三种容量选择,1年质保。随着智能汽车发展,专业存储设备正成为车主刚需。

  • 如何用 AI工具 生成论文选题

    本教程介绍如何利用DeepSeek AI工具生成学术论文选题。首先需要明确自身专业、研究方向、兴趣领域等研究信息。通过特定格式构建提问指令,在DeepSeek平台输入后,AI会基于算法分析生成10个相关选题。用户需从研究价值、创新性、可行性等维度评估选题,筛选出最适合的研究方向。该工具能有效帮助研究者快速获取选题思路,提高学术论文创作效率。

  • AI日报:MiniMax推视频生成模型Hailuo 02;Cursor Pro取消500次请求限制;谷歌发布AI模型 Gemini 2.5 Flash-Lite

    本文汇总了AI领域最新动态:1)Cursor Pro取消500次请求限制;2)稀宇科技推出视频生成模型Hailuo02;3)谷歌发布轻量级AI模型Gemini2.5Flash-Lite;4)科大讯飞星火X1升级版7月上线;5)腾讯元宝推出AI编程模式;6)OpenAI将下架GPT-4.5 API;7)苹果Speech API转录速度超Whisper 55%;8)百度推出数字人互动直播间;9)Meta曾试图高薪挖角OpenAI人才;10)Krea1公测开放,解决"AI感"问题;11)特斯拉Grok车载AI助手即将上线;12)谷歌Gemini新增视频分析功能。

  • 腾讯混元上线“游戏工业级”视觉生成平台:效率最高提升数十倍!

    腾讯5月20日发布混元游戏视觉生成平台,该平台基于混元大模型打造,专为游戏行业内容生产设计。平台能快速生成高质量游戏素材和概念草图,支持多种主流游戏风格,实现创作闭环。通过AI技术,可将整套流程压缩至一个工作页面,用户只需输入提示词即可获得灵感参考图,并直接绘制草图和生成标准三视图及360度旋转演示视频,效率最高提升数十倍。平台还具备角色多视图自动生成能力,上传一张正面图即可自动生成标准三视图和360度展示视频,角色一致性最高达99%。腾讯表示,该平台将显著改善灵感迟滞、多视图缺失等常见问题。

今日大家都在搜的词: