首页 > 业界 > 关键词  > Audiobox最新资讯  > 正文

Meta发布AI音频模型Audiobox:通过语音和自然语言提示生成音频

2023-12-01 10:07 · 稿源:站长之家

划重点:

🔊 Audiobox是Meta推出的新一代音频生成研究模型,结合语音输入和自然语言文本提示,可轻松创建定制音频。

🔊 作为Voicebox的继任者,Audiobox进一步推动音频生成领域,统一了语音、音效和音景的生成和编辑能力。

🔊 为了推动领域的进步并确保负责任的研究,Meta将向研究人员和学术机构提供资金,用于Audiobox的安全和责任研究。

Meta最新发布了Audiobox,这是一款基于语音和自然语言提示生成音频的先进研究模型。通过结合语音输入和文本提示,Audiobox可以轻松生成各种声音,包括语音、音效和音景,从而为多种用例提供定制音频。

Audiobox是Voicebox的继任者,进一步推动了音频生成领域的发展。与Voicebox相比,Audiobox具有更强大的可控性,用户可以使用文本描述提示来指定语音和音效的风格,这是Voicebox不支持的功能。通过同时使用语音输入和文本提示,用户可以实现自由形式的语音重塑,这在当前的模型中尚属首次

image.png

这款模型的独特之处在于,它允许用户使用自然语言提示描述他们想要生成的声音或语音类型。例如,如果有人想要生成一片音景,他们可以给模型一个文本提示,如“一条奔流的河流和鸟儿的鸣叫”。

Audiobox不仅在语音生成方面表现出色,还在音效生成方面表现出色。经过内部测试,Audiobox在质量和相关性方面明显超过先前的最佳模型,并在主观评估中以超过30%的样式相似性优势击败了Voicebox。

为了促进领域的发展并确保研究的负责任性,Meta计划邀请研究人员和学术机构申请资金,用于Audiobox的安全和责任研究。这一举措反映了他们对AI创新的关切,强调了与研究社区合作的重要性。

Audiobox的推出标志着音频生成领域的一项重要进展,Meta希望通过这一创新降低音频创作的门槛,使任何人都能轻松成为音频内容创作者。这对于视频、播客、游戏等多种用例都具有潜在的影响,为未来的音频创作开辟了新的可能性。

举报

  • 相关推荐
  • AI日报:AI内容新规正式生效;美团推出开源大模型LongCat;阶跃发布语音大模型Step-Audio 2 mini

    AI日报栏目每日更新AI领域热点内容,聚焦开发者需求。本期重点包括:阶跃星辰发布端到端语音大模型Step-Audio2 mini,在多项基准测试中表现优异;9月1日起AI生成内容需强制标识;美团推出开源大模型LongCat;上海AI实验室发布多模态大模型InternVL3.5;腾讯ARC团队推出音频生成模型AudioStory;OpenAI发布实时语音模型GPT-realtime;Meta与UCSD合作推出DeepConf技术;xAI代码库遭窃事件;阿里巴巴Qwen团队发布GUI自动化框架;微软推出Copilot Labs实验中心;小红书自动化工具xiaohongshu-mcp上线。

  • AI日报:腾讯推音效生成工具AudioGenie;阿里推智能体WebWatcher;我国首个法律垂直大模型“小包公”发布

    本文介绍了AI领域最新动态:1)腾讯推出电影级音频生成工具AudioGenie,展现中国AI技术实力;2)阿里开源多模态智能体WebWatcher,突破现有系统局限;3)港大等高校联合推出3D建模技术OmniPart,实现模型组件独立性和清晰度;4)Meta发布无需标注数据的通用图像处理模型DINOv3;5)国内首个法律大模型"小包公"发布;6)ChatGPT移动端收入突破20亿美元;7)安卓厂商借鉴灵动岛设计,新芯片推动AI功能普及;8)欧洲AI公司推出仅94MB的超小模型;9)Claude Code新增编程教学模式;10)AI技术被滥用于电商恶意退款;11)IDC报告显示2024年中国AI公有云服务市场将快速增长。

  • BeauEver革新护肤流程,水油双相方案提升养护效率

    新西兰高端护肤品牌BeauEver推出两款双相油敷水,以92:8精准水油配比实现保湿与修护合一。产品通过摇匀即可快速融合水油相,5-10分钟完成高效护理,突破传统繁琐步骤。引力塑颜款侧重紧致亮肤,安肤愈颜款专注舒缓修护,针对不同肌肤需求提供分区护理可能。该系列从实际使用场景出发,解决现代人对高效多效合一的护肤诉求,为追求理性护肤的消费者提供新选择。

  • 三星推出Galaxy Buds3 FE耳机新品:带来更加智能、时尚的音频新体验

    三星电子于2025年8月18日发布新款智能耳机Galaxy Buds3 FE,主打亲民价格与高端性能。新品延续标志性刀锋设计,配备升级版主动降噪(ANC)和Galaxy AI功能,支持跨设备无缝切换和语音交互。通过增强型扬声器实现三频均衡音效,超宽频通话技术确保清晰沟通。耳机采用哑光双色半透明设计,支持与三星生态设备联动,提供智能翻译等AI功能。将于9月5日上市,提供银雾灰、暗羽黑两种配色,进一步扩展三星Galaxy生态体验。

  • “无限量”供应Claude,就是AI IDE们的百亿补贴

    Anthropic于2025年7月28日宣布,将从8月28日起对Claude Code工具新增每周调用限额——因为少数重度用户全天候高频使用,一次使用成本甚至高达数万美元,远远超过普通订阅预期。 同样在上个月,Cursor曾因其“I’ll keep it unlimited”的Pro收费模式悄然变更为计算tokens限制,导致大量用户抱怨“实际上并非无限”,纷纷在社群中吐槽,迫使公司CEO出面道歉、甚至给出退款补偿。 这两�

  • 苹果官网更新:三款MacBook被列为过时产品

    今天苹果官网过时产品名单中新增了三款Mac电脑,具体如下。 MacBook Air(11英寸,2015款) MacBook Pro(13英寸,2017款,配备4个雷雳3端口) MacBook Pro(15英寸,2017款) 据悉,某款设备自苹果停止分销之日起超过7年,便会被归为过时产品”,苹果零售店及苹果授权服务提供商通常不维修过时产品,但苹果表示,MacBook在停止分销后长达10年内仍可能符合电池更换条件,具体取决于

  • B站要变成AI站

    互联网平台都在跟AI结合,B站没有成为例外。从新一季度财报来看,B站的AI味儿也越来越浓了。 8月21日,B站公布第二季度业绩,总营收达73.4亿元人民币,同比增长20%。其中,游戏业务收入为16.1亿元,同比增长60%,广告业务收入为24.5亿元,同比增长20%。由此推动B站毛利率从去年同期的29.9%提升至36.5%,调整后净利润达到5.6亿元,创下历史最好成绩。 从整体来看,B站生态集聚

  • 智谱AI发布AutoGLM 2.0 - 首个为手机而生的通用Agent。

    智谱今天,终于发了AutoGLM2.0。 想一想,AutoGLM1.0的版本,距离我第一次首发写他们,已经过去快10个月了。 那个时候,他们掀起了一波Agent热潮,甚至连A股都出现了智谱概念股,他们也开启了Agent的另一条支线,用视觉的方式来操控原有设备。 当时,我对着我的手机说:我29号要去一趟深圳,你帮我定个罗湖地铁站附近的酒店,预算600元以内,大床房。 然后,我的手机,就像

  • 华为千元内最好的降噪耳机!华为FreeBuds 7i来了:接入鸿蒙智能体

    华为FreeBuds 7i即将登场,预计8月28日预售,9月4日首销。 官方宣传图称其为华为千元内最好的降噪耳机”,支持新一代智慧动态降噪,全频段平均降噪深度28dB。 支持90dB噪声下,消除环境背景音,精准拾取人声。 耳机采用11mm四磁铁动圈单元,支持头部跟踪空间音频,带来声临其境的体验。 关闭降噪最长使用时间为35小时,支持快充,充电10分钟就能听歌4小时。

  • 华为FreeBuds 7i无线耳机预售:售价599元 支持智慧动态降噪4.0

    今日,华为正式宣布旗下华为FreeBuds7i无线耳机开启预售活动,其建议零售价为599元,而参与预售的消费者仅需499元即可将其收入囊中。 在降噪性能上,FreeBuds7i表现十分亮眼。它搭载了华为智慧动态降噪4.0技术,降噪响应生效时间小于0.5秒,全频段平均降噪深度达到28dB,并且降噪系统时延减少了50%。除了常规的三颗麦克风外,这款耳机还新增了骨传导麦克风,能够精准拾取人

今日大家都在搜的词: