开源版Suno来了！AI音乐生成模型YuE可生成专业级的歌声和伴奏

2025-03-28 15:06 · 来源： AIbase基地

近日，由香港科技大学与音乐领域的 DeepSeek 合作开发的开源音乐生成模型 YuE 正式发布，震惊了不少乐迷和音乐创作者。这一模型不仅能够生成多种风格的音乐，还可以模拟人声，给听众带来全新的音乐体验。

YuE 的特点在于其双 LLaMA 语言模型架构，这使其能够无缝适配各种大语言模型，并且能够处理长达5分钟的完整歌曲。这一创新的设计让 YuE 在音乐生成的质量上达到了前所未有的高度，甚至与市场上著名的闭源音乐生成工具 Suno 和 Udio 相抗衡。YuE 可以同时生成专业级的歌声和伴奏，实现了音乐创作的端到端生成。

研究团队在 YuE 中引入了 “双轨版下一 token 预测” 策略，将人声和伴奏轨道分开建模，确保了音乐创作中的细腻度和一致性。这一方法不仅提升了音质，还显著减少了内容重构过程中的信息损失。此外，YuE 的 “结构化渐进生成” 技术让歌曲的主副歌段落能够在同一上下文中交替进行，进一步提高了歌曲的连贯性。

为了避免抄袭，YuE 还开发了独特的音乐上下文学习技术，这让模型在创作时能够从已有的音乐片段中学习而不重复。这一创新不仅提高了模型的音乐性，还增强了其创作的独特性。最终，YuE 在多项评测中展现出卓越的表现，成功赢得了用户的好评。

随着 YuE 的发布，音乐创作的未来将更加充满可能性。无论你是专业音乐人还是业余爱好者，都可以在这个平台上体验 AI 带来的音乐创作乐趣。

项目地址:https://github.com/multimodal-art-projection/YuE

相关推荐

最高提效8倍！腾讯游戏发布专业游戏AI大模型，美术师做动画不用辣么“肝”了

在最近与科隆国际游戏展同期举办的Devcom开发者大会上，AI再次赚足了脸面。微软、腾讯、谷歌、Meta等国际巨头带来超过20场AI相关议题，“AI如何提升游戏美术生产效率”、“AI工具如何与传统工作流无缝集成”、“AI在动画生成、场景构建等具体环节的应用案例”成为开发者们探讨的重点内容。近年来，游戏美术对精细度的要求呈现指数级增长。随之而来的是几何级增长的

AI 游戏美术生产效率
如何用3分钟精准计算AI大模型成本？避免生成一篇万字文章就超支？

AI大模型成本控制指南：实测三步预算法+企业级避坑方案。文章揭露行业痛点：1）价格迷雾：各厂商计费规则差异大，长文本/多模态存在隐藏溢价；2）团队实测GPT-4生成20篇行业分析（50万字）实际账单超预算4倍。解决方案：通过AIbase计算器实现精准预测：①场景化选择自动加载计费规则；②输入需求实时生成动态成本矩阵；③智能规避四大隐性成本（长文本衰减补偿/区域差价预警等）。跨境电商案例显示，使用工具后成本降低60%。核心观点：在AI时代，成本控制能力已成为企业核心竞争力。

AI预算计算模型成本控制 GPT-4计费
荐昆仑万维UniPic 2.0“小钢炮”模型炸场，一个模型搞定理解+生成+编辑

大模型又迎来新一波的迭代周期。近日，从Open AI发布GPT-5，到国内的昆仑万维、商汤、百川智能、智谱等都陆续发布了自己的新模型。其中昆仑万维更是一口气开启了技术周，连续5天每天发布一个新模型，而8月13日发布的，正是其本周发布的第三款模型——多模态统一模型UniPic2.0。 UniPic2.0主打的是，在单一模型中深度融合图像理解、文本到图像生成、图像编辑三大核心能力

大模型多模态 AI生图
豆包1.5轻量版 vs Gemini 2.5闪存版：生成5000字深度文章，哪个模型更合适？

AIbase选型工具通过多维度数据对比，帮助用户精准选择AI模型。文章以豆包和Gemini为例，展示平台如何解决模型选型痛点：自动生成对比报告，评估关键指标如术语准确性、本土案例适配度等。实际案例显示，使用该工具后内容团队效率提升40%，编辑成本下降65%。核心价值在于用数据驱动决策，规避局部优势导致的全局误判，实现场景化精准匹配。

文章搜索核心标签 AI选型
客流易AI功能上线！一键生成开店选址和客流统计分析报告！

客易APP推出AI选址功能，基于海量时空数据与智能算法，为创业者提供精准开店位置评估。该功能通过深度分析客流量、消费能力、周边业态等多维度数据，生成详细选址报告，帮助用户从经验决策升级为智能决策，提升开店成功率与商业价值。

AI选址开店选址商业地理
OpenAI的开源模型现已在IBM watsonx.ai上提供

OpenAI发布两款开源AI模型GPT-OSS-120B和GPT-OSS-20B，允许开发者自由下载、运行和定制。其中120B模型已部署在IBM Watsonx.ai平台，采用专家混合架构，支持本地或云端部署，不受商业用途限制。模型具备高透明度，输出完整推理链，在多项基准测试中表现优异。此次发布标志着OpenAI首次加入开源生态，IBM强调其开放战略，为企业提供灵活、安全的AI开发选择。

OpenAI模型 IBM watsonx.ai
荐AI日报：阿里新发布Qwen3-4B模型；小红书发布开源模型dots.vlm1；MiniMax Speech 2.5语音生成模型上线

AI日报栏目聚焦人工智能领域最新动态：1)阿里发布Qwen3-4B轻量级模型，手机端可运行；2)小红书开源多模态大模型dots.vlm1，在图表推理方面表现突出；3)MiniMax推出语音生成模型Speech2.5，多语种表现提升；4)Midjourney推出HD视频模式，提升专业影像质量；5)Cursor1.4版本增强异步任务处理能力；6)谷歌否认AI搜索影响网站流量，但数据显示用户行为改变；7)MiniCPM-V4.0开源发布，号称"手机上的GPT-4V"；8)AMD与高通宣布支持OpenAI的gpt-oss系列模型；9)腾讯开源WeKnora文档智能解析工具；11)疑似GPT-5信息在GitHub泄露；12)FlowSpeech实现书面语转口语的TTS技术突破。

AI模型移动端AI 阿里通义千问
荐AI日报：阿里开源Qwen-Image-Edit；淘宝“AI万能搜”功能灰度测试；小红书发布DynamicFace人脸生成技术

本期AI日报聚焦多项AI领域创新：1）阿里开源Qwen-Image-Edit图像编辑模型，支持中文渲染与精准文本编辑；2）淘宝测试"AI万能搜"功能，重构电商搜索体验；3）小红书发布DynamicFace人脸生成技术，实现高质量图像视频换脸；4）Gemini API新增URL Context功能，简化网页内容获取流程；5）Nvidia推出小型开放模型Nemotron-Nano-9B-v2，支持智能推理开关；6）马斯克发布Grok Imagine 0.1测试版，进军AI图像生成领域；7）Vercel推出iOS版AI开发工具v0；8）理想汽车发布MindGPT 3.1模型，处理速度提升5倍；9）ToonComposer工具简化动画制作流程；10）ElevenLabs推出视频到音乐生成流程。

AI 开源图像编辑
荐AI日报：Wan 2.2-S2V模型即将发布；字节跳动内测3D Model Generator；微软开源 VibeVoice-1.5B 模型

本期AI日报聚焦多项技术突破：阿里通义万相发布Wan 2.2-S2V模型，实现视频音频同步生成；字节跳动研发3D模型生成工具，降低建模门槛；面壁智能推出MiniCPM-V4.5端侧多模态模型；苹果提出RLCF训练法提升模型性能；微软开源VibeVoice-1.5B支持超长语音合成；谷歌Imagen 4正式上线；英伟达发布Jetson Thor机器人计算平台；Genspark推出AI Designer一键生成品牌方案；豆包上线未成年人保护模式。

AI视频生成多模态AI 阿里通义万相
雷蛇发布幻影战狼V3专业版8K PC专用——专为竞技PC玩家打造的专业无线电竞手柄

雷蛇发布幻影战狼V3专业版8K+PC专用电竞手柄，专为竞技PC玩家打造。该手柄搭载8000Hz轮询率技术、抗漂移TMR摇杆和轻量化无线设计，提供极致速度和精准度。专业版售价1499元，竞技版799元。产品特点包括：可更换摇杆帽、机械触感按键、8向方向键，支持雷云4软件深度自定义。雷蛇表示这是专为PC生态系统打造的专业级手柄，满足电竞选手和硬核玩家对零延迟操控的需求。

8000Hz HyperPolling 抗漂移TMR摇杆

今日大家都在搜的词：

热文

3 天
7天

开源版Suno来了！AI音乐生成模型YuE可生成专业级的歌声和伴奏

最高提效8倍！腾讯游戏发布专业游戏AI大模型，美术师做动画不用辣么“肝”了

如何用3分钟精准计算AI大模型成本？避免生成一篇万字文章就超支？

荐昆仑万维UniPic 2.0“小钢炮”模型炸场，一个模型搞定理解+生成+编辑

豆包1.5轻量版 vs Gemini 2.5闪存版：生成5000字深度文章，哪个模型更合适？

客流易AI功能上线！一键生成开店选址和客流统计分析报告！

OpenAI的开源模型现已在IBM watsonx.ai上提供

荐AI日报：阿里新发布Qwen3-4B模型；小红书发布开源模型dots.vlm1；MiniMax Speech 2.5语音生成模型上线

荐AI日报：阿里开源Qwen-Image-Edit；淘宝“AI万能搜”功能灰度测试；小红书发布DynamicFace人脸生成技术

荐AI日报：Wan 2.2-S2V模型即将发布；字节跳动内测3D Model Generator；微软开源 VibeVoice-1.5B 模型

雷蛇发布幻影战狼V3专业版8K PC专用——专为竞技PC玩家打造的专业无线电竞手柄

今日大家都在搜的词：

热文

AI日报：钉钉十周年发布8.0版本；微信悄悄上线AI播客；阿里开源

iPhone17Pro爆料汇总：橙色版本成最大亮点或迎12项升级

20周年版iPhone或成苹果首款曲面机：一体环绕玻璃+曲面机身

24. 98 万起标配华为ADS 4！鸿蒙智行智界 R7 车型上市

罗永浩播客节目爆火：24小时播放量超2000万晒成绩单求合作

vivo Y500定档9月1日发布配备8200mAh巨无霸电池

字节跳动回应即将发布AI眼镜：早期探索阶段没有发布计划

美团回应网友质疑退款未到账：已修复信息滞后每笔退款可追溯

AI日报：Wan 2.2-S2V模型即将发布；字节跳动内测3D Model Ge

华为鸿蒙智行新款智界 S7 车型上市：：售价22.98万起

罗永浩泡面1小时销售额超280万 2小时售罄：一桶近10元

AI日报：钉钉十周年发布8.0版本；微信悄悄上线AI播客；阿里开源

AI日报：即梦上线智能多帧功能；可灵2.1首尾帧升级；钉钉推语音

iPhone17Pro爆料汇总：橙色版本成最大亮点或迎12项升级

20周年版iPhone或成苹果首款曲面机：一体环绕玻璃+曲面机身

李国庆婚礼收到11万余元善款受助学生寄来祝福

24. 98 万起标配华为ADS 4！鸿蒙智行智界 R7 车型上市

REDMI Note 15标准版发布：售价999元起

罗永浩播客节目爆火：24小时播放量超2000万晒成绩单求合作

vivo Y500定档9月1日发布配备8200mAh巨无霸电池

站长商机