首页 > 业界 > 关键词  > Lyria最新资讯  > 正文

Google DeepMind推AI音乐生成模型Lyria:用AI将文本转化为独特音乐作品

2023-11-17 09:42 · 稿源:站长之家

**划重点:**

1. 🎤 Lyria是Google DeepMind最新AI音乐生成模型,可以从文本中创作高质量音乐,包括乐器和人声。

2. 🎹 与YouTube合作推出的Lyria将为平台引入创意工具,包括Dream Track,一个用于YouTube Shorts的语音克隆工具,以及专为艺术家和制作人设计的音乐AI工具。

3. 🔍 Google DeepMind的音频检测工具SynthID已扩展到覆盖由Lyria生成的音频,通过嵌入水印来检测AI生成的音乐,以保护内容免受编辑和内容侵权。

站长之家(ChinaZ.com)11月17日 消息:Google DeepMind最新推出的AI音乐生成模型Lyria引起了广泛关注,该模型可以从文本中创作独特且高质量的音乐,包括乐器和人声。这一创新是谷歌旗下视频分享平台YouTube的新功能的一部分,旨在让用户能够轻松生成自己的音乐作品。

Lyria的设计目标是为用户提供对输出的风格和表现更为微妙的控制。Demis Hassabis,Google DeepMind的联合创始人兼首席执行官,在Twitter上表示:“仅凭一个文本提示,Lyria就能产生引人入胜的音乐和人声。”

这一新模型将与YouTube合作推出实验性的创意工具,其中包括Dream Track。Dream Track是一个用于YouTube Shorts的语音克隆工具,用户只需提供与艺术家一起制作音乐的文本输入,该工具将生成包含艺术家克隆声音的30秒片段,其中包括T-Pain和Charlie Puth等艺术家的声音。

此外,Lyria还将推动一系列音乐AI工具,旨在帮助艺术家和制作人增强其创意过程。用户可以从零开始创建新音乐或乐器部分,也可以重新构想现有的音乐曲目。

与Lyria的推出同时,Google DeepMind团队还宣布扩展其AI检测工具SynthID,以覆盖由Lyria生成的音频。SynthID最初是在八月底发布的,它可以通过检测直接嵌入图像像素的数字水印来识别由AI生成的图像。现在,这一工具已经扩展到音频领域,通过将水印嵌入到Lyria生成的音频波形中,来保护音乐免受编辑和内容侵权的影响。

image.png

这个水印设计得非常坚固,可以经受噪声添加、MP3压缩以及音轨被加速或减速等编辑,后者是绕过YouTube的ContentID检测工具的常见手段。

在Lyria最新模型推出后,Google DeepMind表示计划继续与其音乐AI孵化器的参与者一起测试AI工具,其中包括环球唱片公司。该唱片公司在八月份与YouTube签署了一项协议,以尝试使用AI工具,为Johnny Cash和Frank Sinatra的亲属提供了AI版本的音乐作品,这些作品已经在YouTube上发布。

Lyria的推出标志着谷歌研究人员长期以来在AI音乐生成领域的实验。在今年一月份,他们推出了MusicLM,该模型可以根据文本提示生成五分钟的音频片段。

举报

  • 相关推荐
  • AI浪潮下,项目经理如何破局 | 2025 PMI项目管理大会

    人工智能正重塑项目管理模式,项目经理需超越传统技能,掌握AI赋能下的效率提升、创新促进与决策优化能力。个人应通过组织平台与业务深度绑定,构建不可替代的核心价值。2025PMI项目管理大会将探讨AI前沿应用,助力从业者系统掌握转型路径,实现个体与组织的双向赋能,在AI时代保持竞争力。

  • DeepSeek崩了上热搜 页面显示“服务器繁忙”

    截至2025年11月3日,大量用户在微博话题#DeepSeek崩了#下集中反馈,DeepSeek平台出现服务异常状况,引发广泛关注。综合各方信息,此次故障呈现多方面表现,对用户使用造成显著影响。 众多用户表示遭遇服务全面中断问题,在尝试使用平台

  • ​你的品牌在豆包、DeepSeek里搜不到?这份GEO品牌监控攻略,3步把曝光拉满

    GEO指数是AI搜索时代的品牌可见度衡量指标,量化品牌被AI引用、推荐和对比的频率与深度。与传统SEO比拼搜索排名不同,GEO衡量的是品牌在AI回答中的提及率和好感度。数据显示,高GEO指数品牌在AI搜索中的转化率是传统SEO的3.4倍。文章通过案例说明,企业可通过监控竞品差距、补充缺失内容关键词、优化AI提示词等策略提升GEO指数。建议立即使用AIBase平台免费体验GEO监控,把握AI搜索新机遇。

  • 品牌在deepseek、豆包里排第几?免费GEO排名查询工具帮你一键看清

    随着AI搜索普及,传统SEO正被GEO(生成式引擎优化)取代。GEO核心是提升品牌在AI生成答案中的可见度,而非获取点击流量。数据显示超60%用户已使用AI搜索,若品牌未被AI提及将失去流量入口。文章推荐免费工具AIBase,支持多平台一键检测品牌在主流AI助手的曝光排名、竞品对比及可视化报告,并提供内容权威性、语义化表达等GEO优化策略,帮助品牌在AI时代建立竞争优势。

  • 百度智能云这项开源,让 DeepSeek-V3.2 推理服务吞吐提升 2 倍

    10月28日,百度智能云联合SGLang社区开源针对DeepSeek-V3.2优化的多token预测(MTP)技术代码。该技术通过批量生成和集中验证机制,使模型解码吞吐量提升超2倍,突破传统自回归解码的序列化瓶颈。此次开源的MTP方案已完成与DeepSeek-V3.2稀疏注意力架构的深度适配,并经过百度内部业务验证,开发者可"开箱即用"获得稳定可靠的推理加速能力。

  • AI日报:可复刻音色的MiniMax Speech 2.6发布;TikTok推AI剪辑新工具“Smart Split”;Cursor 2.0发布

    本期AI日报聚焦多项技术突破:MiniMax发布低延迟语音合成系统Speech 2.6,实现实时交互;蚂蚁数科与宁波银行打造的金融AI方案入选国际标准;智源推出具身操作能力的Emu3.5多模态模型;Cursor 2.0通过自研模型实现多智能体协同编程;xAI升级Grok新增视频生成功能;OpenAI推出可定制安全模型;TikTok推出AI剪辑工具Smart Split;微软发布强化学习框架Agent Lightning提升大模型训练效率。

  • AI日报:昆仑万维SkyReels V3模型上线;月之暗面推Kimi Linear模型;MiniMax Music 2.0 发布

    本期AI日报聚焦多领域创新:昆仑万维推出SkyReels V3模型,整合顶尖视频生成能力;月之暗面Kimi Linear模型处理长文本速度提升2.9倍;MiniMax Music 2.0实现专业级音乐创作;字节跳动启动豆包股权激励计划吸引AI人才;苹果iOS 27将迎AI重大升级,Siri更个性化;Dia浏览器融合Arc设计理念与AI技术;文心魔法漫画工具实现一键生成连载作品;谷歌Gemini Canvas新增PPT自动生成功能,由Gemini 2.5 Pro驱动,提升职场效率。

  • MiniMax让AI语音有了新基建

    熟悉MiniMax的人都了解这家公司的调性——不鸣则已,一鸣惊人。 要么选择低调,要么发动技术连招,其发展路径呈现出鲜明的“技术深潜”与“节点式爆发“的双重特征。 十月的最后一周,再次进入MiniMax式技术迭代新周期。MiniMax模型“全家桶”全面向Agent方向进化,基础文本模型M1升级至M2,“专为Agent和代码而生”;视频模型升级至Hailuo2.3,Hailuo Video Agent迭代为“全模态全�

  • 中国AI算力突围:东方超算Deep X算力盒子超国际竞品82%,重新定义行业标准

    中国公司东方超算发布Deep X G20系列AI工作站,在MLPerf测试中性能超越NVIDIA DGX Spark达82%,价格持平,实现性能与性价比"双超越"。产品搭载Intel Ultra 9285处理器和NVIDIA RTX PRO 5000显卡,AI算力达1824 TOPS,体积仅2.7L。通过三大技术创新实现突破:智能异构计算引擎提升资源利用率40%;统一推理运行时支持多框架;深度硬件优化提升关键算子性能50-200%。该产品打破国际巨头垄断,已在量化金融、医疗影像等领域实现显著投资回报,标志着中国AI硬件实现重要突破。

  • 全新开源的DeepSeek-OCR,可能是最近最惊喜的模型。

    ​AI圈虽然天天卷,但是很多的模型,真的越来越无聊了。 每天就是跑分又多了几个点。 直到昨天,DeepSeek久违的发了一个新模型。 DeepSeek-OCR。 这玩意,是真的有点酷。

今日大家都在搜的词: