首页 > 业界 > 关键词  > Lyria最新资讯  > 正文

Google DeepMind推AI音乐生成模型Lyria:用AI将文本转化为独特音乐作品

2023-11-17 09:42 · 稿源:站长之家

**划重点:**

1. 🎤 Lyria是Google DeepMind最新AI音乐生成模型,可以从文本中创作高质量音乐,包括乐器和人声。

2. 🎹 与YouTube合作推出的Lyria将为平台引入创意工具,包括Dream Track,一个用于YouTube Shorts的语音克隆工具,以及专为艺术家和制作人设计的音乐AI工具。

3. 🔍 Google DeepMind的音频检测工具SynthID已扩展到覆盖由Lyria生成的音频,通过嵌入水印来检测AI生成的音乐,以保护内容免受编辑和内容侵权。

站长之家(ChinaZ.com)11月17日 消息:Google DeepMind最新推出的AI音乐生成模型Lyria引起了广泛关注,该模型可以从文本中创作独特且高质量的音乐,包括乐器和人声。这一创新是谷歌旗下视频分享平台YouTube的新功能的一部分,旨在让用户能够轻松生成自己的音乐作品。

Lyria的设计目标是为用户提供对输出的风格和表现更为微妙的控制。Demis Hassabis,Google DeepMind的联合创始人兼首席执行官,在Twitter上表示:“仅凭一个文本提示,Lyria就能产生引人入胜的音乐和人声。”

这一新模型将与YouTube合作推出实验性的创意工具,其中包括Dream Track。Dream Track是一个用于YouTube Shorts的语音克隆工具,用户只需提供与艺术家一起制作音乐的文本输入,该工具将生成包含艺术家克隆声音的30秒片段,其中包括T-Pain和Charlie Puth等艺术家的声音。

此外,Lyria还将推动一系列音乐AI工具,旨在帮助艺术家和制作人增强其创意过程。用户可以从零开始创建新音乐或乐器部分,也可以重新构想现有的音乐曲目。

与Lyria的推出同时,Google DeepMind团队还宣布扩展其AI检测工具SynthID,以覆盖由Lyria生成的音频。SynthID最初是在八月底发布的,它可以通过检测直接嵌入图像像素的数字水印来识别由AI生成的图像。现在,这一工具已经扩展到音频领域,通过将水印嵌入到Lyria生成的音频波形中,来保护音乐免受编辑和内容侵权的影响。

image.png

这个水印设计得非常坚固,可以经受噪声添加、MP3压缩以及音轨被加速或减速等编辑,后者是绕过YouTube的ContentID检测工具的常见手段。

在Lyria最新模型推出后,Google DeepMind表示计划继续与其音乐AI孵化器的参与者一起测试AI工具,其中包括环球唱片公司。该唱片公司在八月份与YouTube签署了一项协议,以尝试使用AI工具,为Johnny Cash和Frank Sinatra的亲属提供了AI版本的音乐作品,这些作品已经在YouTube上发布。

Lyria的推出标志着谷歌研究人员长期以来在AI音乐生成领域的实验。在今年一月份,他们推出了MusicLM,该模型可以根据文本提示生成五分钟的音频片段。

举报

  • 相关推荐
  • 别再猜了!手把手教你用数据选择AI模型,我的Gemini 2.5 Flash-Lite vs DeepSeek选型心得

    开发者分享模型选择心路历程:从盲目试错到数据驱动。曾因追求低价模型导致成本飙升,后通过AIbase平台对比Gemini 2.5 Flash-Lite和DeepSeek-V3,基于价格、上下文长度和代码能力等数据,最终选择更适合代码生成任务的DeepSeek-V3。强调没有“最好”的模型,只有“最适合”的模型,建议开发者善用专业工具进行数据驱动决策,避免隐性成本。

  • AI日报:DeepSeek V3.1正式发布;企业微信5.0推出全新AI能力;快手 Klear-Reasoner 模型成功登顶

    AI日报栏目聚焦人工智能领域最新动态。DeepSeek V3.1发布,大幅增强长文档分析和代码理解能力;企业微信5.0集成智能搜索、总结和机器人功能;快手Klear-Reasoner模型数学推理准确率超90%;谷歌Docs新增AI语音朗读功能;Firecrawl完成1450万美元融资并推出V2版本API;Meta上线AI语音翻译功能;微软Excel集成Copilot实现一键数据分析;Claude桌面客户端推动AI编程可视化;苹果Xcode将原生集成Cl

  • 免费使用!腾讯地图已接入DeepSeek-V3.1

    DeepSeek V3.1于2025年8月21日发布并开源,腾讯地图率先完成接入。新版AI助手“AI叮当”在三大核心能力显著提升:思考效率更高,响应更快;上下文理解更强,支持多轮连贯对话;智能体调用更精准,尤其在中文网页理解和跨领域搜索方面表现突出。依托升级,AI叮当可提供个性化行程规划、周边推荐及景点知识问答等智能出行服务,让导航升级为全程智能生活陪伴。

  • Gemini 2.5 Flash-Lite与 DeepSeek-V3 深度对比:谁在性价比上更胜一筹?

    面对琳琅满目的大模型API,开发团队常陷入选择困境。文章指出,2024年既是机遇也是挑战的时代,闭源模型选择丰富但性能与成本平衡复杂。通过AIbase等数据驱动平台进行客观对比至关重要。以Gemini 2.5 Flash-Lite和DeepSeek-V3为例,前者综合能力强适合多语言场景,后者在代码生成和成本控制上优势明显。建议开发者明确需求,通过实际测试验证模型表现,理性选择最适合的方案。

  • 检出率超95%,支持透明液体识别!INDEMIND脏污识别:更快、更准、更智能

    扫地机器人技术正从“盲目清扫”向“智能识别”进化。INDEMIND推出立体视觉污染识别方案,能精准识别固态、液态、粉末及混合四类污渍,检出率超95%。该技术结合智能决策引擎,实现自主调整清洁参数,避免二次污染。同时提供单目、双目及三目模块矩阵,支持快速适配升级,推动行业迈向精准化智能清洁新阶段。

  • INDEMIND:高需求和低渗透之间,服务机器人为何规模化落地难?

    在全球经济面临劳动力短缺的背景下,加之疫情的进一步催化,服务机器人取得了蓬勃发展,预计 2022 年,全球服务机器人市场规模将达到 217 亿美元,然而尽管如此,在高速发展之下,机器人的行业渗透率却并未明显提高,究其原因在于红利之后,机器人的规模化商业落地过程走的并不顺利...作为国内领先的机器人关键AI技术供应商,INDEMIND在机器人的导航、避障、决策、AI交

  • 智能体迎来“DeepSeek时刻”,为何主角是纳米AI?

    大模型重塑了人工智能的产业格局,但却没有彻底颠覆人类的生产模式。 在这背后,并非其技术力量不足,而是当前的应用形态仍停留在“工具赋能”的初级阶段,大模型的潜力被束缚在碎片化场景中,未能转化为重构生产逻辑的核心动能。 正如360集团创始人、董事长周鸿祎所言,大模型的能力其实已经相当强大,甚至超越了我们中的许多人。只是其潜力尚未被挖掘。 而�

  • AI日报:AI内容新规正式生效;美团推出开源大模型LongCat;阶跃发布语音大模型Step-Audio 2 mini

    AI日报栏目每日更新AI领域热点内容,聚焦开发者需求。本期重点包括:阶跃星辰发布端到端语音大模型Step-Audio2 mini,在多项基准测试中表现优异;9月1日起AI生成内容需强制标识;美团推出开源大模型LongCat;上海AI实验室发布多模态大模型InternVL3.5;腾讯ARC团队推出音频生成模型AudioStory;OpenAI发布实时语音模型GPT-realtime;Meta与UCSD合作推出DeepConf技术;xAI代码库遭窃事件;阿里巴巴Qwen团队发布GUI自动化框架;微软推出Copilot Labs实验中心;小红书自动化工具xiaohongshu-mcp上线。

  • Google Gemini vs Deepseek:谁更适合你的业务场景?AI大模型选型终极对比指南

    企业在选择大模型时面临两难:国际大厂的Gemini技术先进,但国内DeepSeek性价比突出。AIbase平台通过真实场景测试数据指出:1)跨境电商客服场景中,Gemini多语言识别准确率提升12%,但需注意API延迟问题;2)金融研报分析场景下,DeepSeek支持128K长文本且成本仅为Gemini的1/3。决策关键:抛开参数迷雾,聚焦成本、响应速度、语言支持和场景匹配四大维度。AIbase提供可视化对比工具,3分钟生成专属选型报告,让技术决策不再玄学。

  • 2025年大模型选型核心指南:Beyond GPT-4,如何理性评估Qwen、DeepSeek等强者?

    大模型选择能力已成为AI时代企业核心竞争力。文章提出“能力-成本-场景”三维评估框架,强调需超越单一指标崇拜,基于客观数据和实际需求进行理性选择。通过Qwen2-Plus与DeepSeek-V3的对比分析,展示不同模型在特定场景下的差异化优势。建议企业建立科学选型流程,采用专业工具进行多维度评估,通过三阶段验证策略确保决策既数据驱动又经实践检验。最终目标是选择最适合业务场景的模型,而非盲目追求流行模型。

今日大家都在搜的词: