首页 > 业界 > 关键词  > Lyria最新资讯  > 正文

Google DeepMind推AI音乐生成模型Lyria:用AI将文本转化为独特音乐作品

2023-11-17 09:42 · 稿源:站长之家

**划重点:**

1. 🎤 Lyria是Google DeepMind最新AI音乐生成模型,可以从文本中创作高质量音乐,包括乐器和人声。

2. 🎹 与YouTube合作推出的Lyria将为平台引入创意工具,包括Dream Track,一个用于YouTube Shorts的语音克隆工具,以及专为艺术家和制作人设计的音乐AI工具。

3. 🔍 Google DeepMind的音频检测工具SynthID已扩展到覆盖由Lyria生成的音频,通过嵌入水印来检测AI生成的音乐,以保护内容免受编辑和内容侵权。

站长之家(ChinaZ.com)11月17日 消息:Google DeepMind最新推出的AI音乐生成模型Lyria引起了广泛关注,该模型可以从文本中创作独特且高质量的音乐,包括乐器和人声。这一创新是谷歌旗下视频分享平台YouTube的新功能的一部分,旨在让用户能够轻松生成自己的音乐作品。

Lyria的设计目标是为用户提供对输出的风格和表现更为微妙的控制。Demis Hassabis,Google DeepMind的联合创始人兼首席执行官,在Twitter上表示:“仅凭一个文本提示,Lyria就能产生引人入胜的音乐和人声。”

这一新模型将与YouTube合作推出实验性的创意工具,其中包括Dream Track。Dream Track是一个用于YouTube Shorts的语音克隆工具,用户只需提供与艺术家一起制作音乐的文本输入,该工具将生成包含艺术家克隆声音的30秒片段,其中包括T-Pain和Charlie Puth等艺术家的声音。

此外,Lyria还将推动一系列音乐AI工具,旨在帮助艺术家和制作人增强其创意过程。用户可以从零开始创建新音乐或乐器部分,也可以重新构想现有的音乐曲目。

与Lyria的推出同时,Google DeepMind团队还宣布扩展其AI检测工具SynthID,以覆盖由Lyria生成的音频。SynthID最初是在八月底发布的,它可以通过检测直接嵌入图像像素的数字水印来识别由AI生成的图像。现在,这一工具已经扩展到音频领域,通过将水印嵌入到Lyria生成的音频波形中,来保护音乐免受编辑和内容侵权的影响。

image.png

这个水印设计得非常坚固,可以经受噪声添加、MP3压缩以及音轨被加速或减速等编辑,后者是绕过YouTube的ContentID检测工具的常见手段。

在Lyria最新模型推出后,Google DeepMind表示计划继续与其音乐AI孵化器的参与者一起测试AI工具,其中包括环球唱片公司。该唱片公司在八月份与YouTube签署了一项协议,以尝试使用AI工具,为Johnny Cash和Frank Sinatra的亲属提供了AI版本的音乐作品,这些作品已经在YouTube上发布。

Lyria的推出标志着谷歌研究人员长期以来在AI音乐生成领域的实验。在今年一月份,他们推出了MusicLM,该模型可以根据文本提示生成五分钟的音频片段。

举报

  • 相关推荐
  • DeepSeek回应聊天记录搜索:正在灰度测试 并非全量推送

    近日,不少网友在社交平台上发帖称,DeepSeek能查聊天记录了。 今日实测发现,DeepSeek网页版和APP页面均可通过关键词搜索,查询用户和DeepSeek之间的历史聊天内容。 将DeepSeek APP检查更新至2.1.0(213)版本后,其侧边栏顶部会新出现搜索聊天内容”搜索框。 框内输入关键词后页面会显示多条包含这个词的历史聊天记录,点击某条聊天记录即可定位至具体聊天位置。

  • AI日报:DeepSeek识图模式灰测;小红书成立AI一级部门;阿里发布程序员“数字分身”QoderWake

    本期AI日报涵盖8大热点:1. DeepSeek开启多模态识图灰度测试,视觉理解能力落地;2. 文心一言5.1预览版上线LMSYS,全球排名第13;3. 小红书成立AI一级部门“Dots”及海外团队;4. Chrome发布Prompt API,浏览器原生AI时代来临;5. 阿里发布QoderWake,实现代码修复全流程无人值守;6. 蚂蚁集团开源万亿级大模型Ling-2.6-1T;7. 巨日禄与火山引擎合作,AI短剧进入工业化时代;8. Gemini迎史诗级更新,一键生成Office文档。

  • 时隔一个月又崩了!DeepSeek网页及API服务出现异常 官方称正在修复

    今日,多名用户在社交平台反馈DeepSeek服务异常,平台对话页面提示服务器繁忙,请稍后重试”。官方服务状态网站显示DeepSeek网页及API服务不可用。今日下午,官方状态页面更新信息,确认问题已定位,正在实施修复。

  • DeepSeek首次有了视觉能力,技术论文却被它连夜删掉了

    DeepSeek做了件罕见的事情:在终于开始灰测多模态能力后,它放出了一篇解释背后技术的论文,但这篇论文却在发布没多久就又被悄悄撤掉。 4月29日,DeepSeek研究员陈小康在X发布一条推文——现在,我们可以看见你了。配图中,DeepSeek 标志性的鲸鱼 logo 摘下眼罩,露出了眼睛。 过去,DeepSeek 最被外界熟知的是它在文本、代码和推理任务上的能力。但真实世界里的问题,并不总�

  • 填补空白!DeepSeek灰度上线识图模式

    DeepSeek正灰度测试识图模式,用户可在网页端和App端上传图片进行内容理解、描述与分析,填补了多模态能力的空白。该模式与快速、专家模式并列,作为独立一级入口存在,表明视觉理解被定位为核心能力。部分用户已可使用,但另一些用户虽看到入口却收到暂不可用的提示。实测显示,当前开放的主要是图片理解能力,涵盖视觉问答、截图分析等场景,尚未支持图像生成、视频理解或跨模态生成,更接近视觉语言模型范畴。

  • INDEMIND:家庭机器人的范式革命,从机械执行到理解空间

    家庭机器人历经扫地机、陪伴机器人等产品形态,始终停留在“自动化工具”阶段,缺乏对家庭环境的真正理解。传统SLAM技术虽能精准建图,却无法赋予机器人区分沙发与餐桌的“生活常识”。大模型技术爆发后,行业竞争维度从硬件参数转向空间认知深度。未来,机器人需具备“感知-理解-决策-执行”的完整智能闭环,从“执行指令”升级为“理解空间”,重构家庭服务商业逻辑,实现从硬件销售到全场景服务运营的范式革命。

  • 小艺Claw上线自进化能力越用越懂你,接入DeepSeek V4逻辑推理跃迁

    小艺Claw上线30天内完成10余次架构迭代与20余项核心能力交付,成为首个获国家级智库认证的终端厂商Claw类智能体。4月29日重磅更新引入自进化能力,可记忆用户偏好与技能,越用越懂你;同时接入DeepSeek+V4模型,实现百万级超长上下文处理与逻辑推理跃迁。此外,Skills市场不断丰富,涵盖金融、生活、开发等场景,并基于鸿蒙星盾架构确保数据安全。用户无需部署,在HarmonyOS 6及以上设备上打开小艺APP即可预约体验。

  • 华为小艺Claw重磅更新!正式接入DeepSeek V4、支持自进化

    华为宣布鸿蒙版龙虾小艺Claw重磅更新,新版本号为11.6.3.300。 此次升级最大亮点是上线自进化能力,小艺能够自主学习并记忆用户使用习惯、创作风格与日常指令偏好,无需反复重复同类要求,长期使用后适配度和响应精准度持续提升,形成专属化智能助手体验。

  • 小米自研AI大模型!Xiaomi MiMo再次登顶全球第一

    小米官方今天发文宣布,小米技术官方宣布,在OpenRouter平台最新数据中,Hermes Agent登顶全球调用量榜首,日Token调用量达2910亿,周调用量超1.75万亿。 小米自研MiMo模型成为第一大贡献模型,近一个月累计贡献1.45万亿Token调用量。

  • DeepSeek-V4 预览版正式上线:定价揭晓

    DeepSeek今日正式发布其全新系列模型DeepSeek-V4的预览版本,并同步进行开源。此次发布标志着AI模型在超长上下文处理能力上迈入了一个新的、更普及的阶段。 根据官方发布的信息,DeepSeek-V4系列模型有两个核心版本:性能更强的DeepSeek-V4-Pro和更侧重经济高效的DeepSeek-V4-Flash。即日起,用户便可在官方网站和手机App上与最新的DeepSeek-V4对话,体验其1M(一百万)超长上下文的特性。

今日大家都在搜的词: