Meta发布AI音频模型Audiobox：通过语音和自然语言提示生成音频

2023-12-01 10:07 · 稿源：站长之家

划重点:
🔊 Audiobox是Meta推出的新一代音频生成研究模型，结合语音输入和自然语言文本提示，可轻松创建定制音频。
🔊 作为Voicebox的继任者，Audiobox进一步推动音频生成领域，统一了语音、音效和音景的生成和编辑能力。
🔊 为了推动领域的进步并确保负责任的研究，Meta将向研究人员和学术机构提供资金，用于Audiobox的安全和责任研究。

Meta最新发布了Audiobox，这是一款基于语音和自然语言提示生成音频的先进研究模型。通过结合语音输入和文本提示，Audiobox可以轻松生成各种声音，包括语音、音效和音景，从而为多种用例提供定制音频。

Audiobox是Voicebox的继任者，进一步推动了音频生成领域的发展。与Voicebox相比，Audiobox具有更强大的可控性，用户可以使用文本描述提示来指定语音和音效的风格，这是Voicebox不支持的功能。通过同时使用语音输入和文本提示，用户可以实现自由形式的语音重塑，这在当前的模型中尚属首次。

这款模型的独特之处在于，它允许用户使用自然语言提示描述他们想要生成的声音或语音类型。例如，如果有人想要生成一片音景，他们可以给模型一个文本提示，如“一条奔流的河流和鸟儿的鸣叫”。

Audiobox不仅在语音生成方面表现出色，还在音效生成方面表现出色。经过内部测试，Audiobox在质量和相关性方面明显超过先前的最佳模型，并在主观评估中以超过30%的样式相似性优势击败了Voicebox。

为了促进领域的发展并确保研究的负责任性，Meta计划邀请研究人员和学术机构申请资金，用于Audiobox的安全和责任研究。这一举措反映了他们对AI创新的关切，强调了与研究社区合作的重要性。

Audiobox的推出标志着音频生成领域的一项重要进展，Meta希望通过这一创新降低音频创作的门槛，使任何人都能轻松成为音频内容创作者。这对于视频、播客、游戏等多种用例都具有潜在的影响，为未来的音频创作开辟了新的可能性。

（举报）

Meta发布AI音频模型Audiobox：通过语音和自然语言提示生成音频

Meta AI新增生成式AI视频编辑功能：秒换服装、场景

荐AI日报：百度发布“绘想”平台与MuseSteamer；阿里音频驱动全身数字人模型OmniAvatar

Meta拟重金加码AI赛道，传将斥资超百亿美元投资Scale AI

Meta想要用AI搞定广告制作流程的“每一步自动化”

Meta整合AI团队实力跃升，OpenAI/微美全息多维技术发展锚定前沿未来

Meta V-JEPA 2模型来袭，OpenAI/微美全息AI创新跃升赋能千行百业变革

Meta拟百亿美元投资Scale AI，微美全息（WIMI.US）端侧多模态AI加速开启科技新局

BYDFi 亮相首尔Meta Week 2025，聚焦Web3愿景与全球合规战略

探营“数龙杯”参赛团队，Helix Studio努力打造互动影游2.0

山姆·奥特曼称Meta用上亿美元“挖角”失败：OpenAI顶尖人才没人跳槽

热文

小米汽车回应YU7是否难破窗：无需担心随车赠送破窗锤

特斯拉中国宣布Model 3/Y长续航版续航提升

小鹏G7官宣7月3日发布全球首款L3级算力车型

董明珠说自己尽量少说话让年轻管理团队走向台前

安克修改召回方案充电宝泡盐水处理后可获赔

小米YU7将开启限时改配非准现车锁单用户可参与

站长商机