趣AI | 谷歌发布新AI模型AudioLM，几秒音频提示即可生成同风格语音和钢琴曲

2022-10-10 15:01 · 稿源：站长之家

站长之家（ChinaZ.com）10月10日消息:最近，谷歌研究人员开发了一项人工智能系统AudioLM，只需输入几秒钟的音频即可生成听起来相似风格的音频，包括钢琴音乐，生成的声音听起来与原始音频的音色几乎没有区别。

AudioLM 是一个纯音频模型，在没有任何文本或音乐符号表示的情况下进行训练。该技术类似于语言模型，主要根据提示语音内容，自行预测并生成更多关联的内容。不过，AudioLM尚未向公众开放，

谷歌称，它可以加快音频生成的人工智能训练过程，并最终自动生成音乐为视频配音。与当前依赖基于文本的数据的系统不同，AudioLM 不需要事先标记或转录。它可以模仿音频的音高、音色、强度和清晰度，以及背景噪音和说话者的呼吸节奏。

据官网介绍，AudioLM将输入音频映射到一系列离散标记，并将音频生成转换为该表示空间中的语言建模任务。通过对原始音频波形的大型语料库进行训练，AudioLM学会了在给出简短提示的情况下生成自然和连贯的语音内容。在对语音进行训练时，在没有任何抄本或注释的情况下，AudioLM生成语音不仅语法正确和语义连贯，同时还保持说话者身份特征、口音和韵律。

此外，AudioLM 在没有任何符号表示的情况下接受过钢琴音乐的训练，它也可以学习生成连贯的钢琴音乐。AudioLM 网站展示了基于一小段钢琴音乐，系统自动生成更长的连贯同一种风格的的钢琴音乐。

谷歌在其AudioLM 网站上分享了示例，感兴趣的可访问链接了解，网址：https://google-research.github.io/seanet/audiolm/examples/。

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
Stability AI发布音频模型 Stable Audio2.0:支持生成多种类型音乐时长达3分钟

著名开源大模型平台Stability.ai在官网正式发布了音频模型StableAudio2.0。这一版本支持用户通过文本或音频生成多种类型的高质量音乐，时长可达3分钟44.1kHz。随着Stability.ai不断推出新功能和技术，用户可以期待更多高质量、多样化的音乐生成体验。

StableAudio StableAudio2.0 AI头条
荐suno劲敌！AI音乐生成工具Udio正式发布输入文字即可生成音乐

一款名为Udio的AI音乐生成工具正式对外发布，引起了广泛关注。这款工具的亮点在于用户可以通过简单的文字描述，轻松创作出带有歌词的音乐作品，极大地降低了音乐创作的门槛。随着AI技术的不断进步，我们有理由相信，Udio将在未来的数字音乐产业中扮演重要角色。

Udio AI头条
荐文本生成3分钟44.1 kHz 音乐，Stable Audio 2.0重磅发布！

4月4日，著名开源大模型平台Stability.ai在官网正式发布了，音频模型StableAudio2.0。StableAudio2.0支持用户通过文本或音频，一次性可生成3分钟44.1kHz的摇滚、爵士、电子、嘻哈、重金属、民谣、流行、乡村等20多种类型的高质量音乐。StableAudio2.0免费赠送20积分，生成的音乐可以商业化，这对于抖音、快手、B站的视频自媒体用户来说挺有帮助的。

StableAudio
AI音乐生成器Udio地址多少 Udio怎么用详细使用教程

Udio是一款引起广泛关注的AI音乐生成工具，用户可以通过简单的文字描述轻松创作带有歌词的音乐作品。这款工具支持多种音乐类型和风格，如EDM、钢琴爵士、新灵魂乐等，满足不同用户的需求。您可以通过单击轨道页面上的“扩展”按钮或在上下文菜单中选择“扩展轨道”来访问扩展模式。

Udio
AI音乐生成器Udio怎么用？Udio怎么生成音乐详细使用教程（附使用地址）

产品简介:AI音乐生成工具Udio正式发布，用户可以通过简单的文字描述创作带有歌词的音乐作品。这一新工具极大地降低了音乐创作的门槛。您可以通过单击轨道页面上的“扩展”按钮或在上下文菜单中选择“扩展轨道”来访问扩展模式。

Udio
Udio免费内测申请地址 Udio AI生成音乐官网在线体验入口

Udio宣布推出其最新的AI音乐生成工具，让用户可以通过简单的文字描述轻松生成带有歌词的音乐作品。该工具涵盖了广泛的音乐类型和风格，包括EDM、钢琴爵士、新灵魂乐和极端金属等，以满足不同用户的音乐需求。内测用户每个人每月最多可以生成1200首歌曲！

Udio Udio内测地址
Azure AI Studio官网体验入口微软AI智能语音生成服务使用地址

AzureAIStudio-语音服务是微软Azure提供的一套人工智能服务，其中包括语音服务。这些服务可能包括语音识别、语音合成、语音翻译等功能，帮助开发者在他们的应用程序中集成语音相关的智能功能。欲了解更多详情和开始使用AzureAIStudio的语音服务，请访问AzureAIStudio-语音服务官方网站。

AzureAIStudio
Udio音乐生成器详细使用方法教程 Suno AI最强劲敌使用指南

Udio，这个AI音乐创作工具，正火热地挑战行业巨头Suno.ai呢！它提供了各种各样的音乐创作服务，不仅赢得了艺术家的喜爱吸引了投资者的目光，让大家都在聊论音乐产业的未来会怎样变化。还可以用括号来指定和声。

Udio Udio怎么使用 Udio教程
Intel发布Gaudi 3 AI加速器：4倍性能提升、无惧1800亿参数大模型

美国当地时间4月9日，Intel举办了一场面向客户和合作伙伴的IntelVision2024产业创新大会，做出多项重磅宣布，包括全新的Gaudi3AI加速器，包括全新的至强6品牌，以及涵盖全新开放、可扩展系统，下一代产品和一系列战略合作的全栈解决方案。预计到2030年，全球半导体市场规模将达1万亿美元，AI是主要推动力，不过在2023年，只有10％的企业能够成功将其AIGC项目产品化。Intel将利用至强处理器、Gaudi加速器，推出AIGC流水线的参考实现，发布技术概念框架，并继续加强IntelTiber开发者云平台基础设施的功能。

Intel 半导体市场 AI加速器
AI制作故事视频平台LTX Studio：给出主题就能生成画面一致视频

LTXStudio是一款综合性的、由人工智能驱动的电影制作平台。你只需要写一个故事主题，然后由AI生成故事和能保持画面一致的主角，然后根据故事画出一张张分镜，每张分镜支持生成视频和编辑，导出合并就是一个完整的故事短片。不顾该平台已经开启候选列表，可以加入排队获取早期访问权限。

LTXStudio AI头条

今日大家都在搜的词：

热文

3 天
7天

趣AI | 谷歌发布新AI模型AudioLM，几秒音频提示即可生成同风格语音和钢琴曲

今日大家都在搜的词：

热文

站长商机