Meta发布AI音频模型Audiobox：通过语音和自然语言提示生成音频

2023-12-01 10:07 · 稿源：站长之家

划重点:
🔊 Audiobox是Meta推出的新一代音频生成研究模型，结合语音输入和自然语言文本提示，可轻松创建定制音频。
🔊 作为Voicebox的继任者，Audiobox进一步推动音频生成领域，统一了语音、音效和音景的生成和编辑能力。
🔊 为了推动领域的进步并确保负责任的研究，Meta将向研究人员和学术机构提供资金，用于Audiobox的安全和责任研究。

Meta最新发布了Audiobox，这是一款基于语音和自然语言提示生成音频的先进研究模型。通过结合语音输入和文本提示，Audiobox可以轻松生成各种声音，包括语音、音效和音景，从而为多种用例提供定制音频。

Audiobox是Voicebox的继任者，进一步推动了音频生成领域的发展。与Voicebox相比，Audiobox具有更强大的可控性，用户可以使用文本描述提示来指定语音和音效的风格，这是Voicebox不支持的功能。通过同时使用语音输入和文本提示，用户可以实现自由形式的语音重塑，这在当前的模型中尚属首次。

这款模型的独特之处在于，它允许用户使用自然语言提示描述他们想要生成的声音或语音类型。例如，如果有人想要生成一片音景，他们可以给模型一个文本提示，如“一条奔流的河流和鸟儿的鸣叫”。

Audiobox不仅在语音生成方面表现出色，还在音效生成方面表现出色。经过内部测试，Audiobox在质量和相关性方面明显超过先前的最佳模型，并在主观评估中以超过30%的样式相似性优势击败了Voicebox。

为了促进领域的发展并确保研究的负责任性，Meta计划邀请研究人员和学术机构申请资金，用于Audiobox的安全和责任研究。这一举措反映了他们对AI创新的关切，强调了与研究社区合作的重要性。

Audiobox的推出标志着音频生成领域的一项重要进展，Meta希望通过这一创新降低音频创作的门槛，使任何人都能轻松成为音频内容创作者。这对于视频、播客、游戏等多种用例都具有潜在的影响，为未来的音频创作开辟了新的可能性。

（举报）

相关推荐

关键词：

REDMI与Bose达成合作：REDMI K90 Pro Max要做行业第一音频

Redmi与声学巨头Bose达成深度合作，基于Bose 60年声学技术积淀，在K90 Pro+Max机型上实现重大突破：创新集成立体声扬声器系统，通过增大发声单元体积与优化腔体结构，动态范围提升30%，瞬态响应速度提高50%，实现零失真输出。该机还搭载骁龙8 Gen3处理器、7560mAh硅碳负极电池、100W快充及专业影像系统，经2000小时专业调音达到行业领先水准，旨在重新定义移动设备音频标准，即将开启全球预售。
荐ROBOT PHONE登场：荣耀为AI终端开了自进化的未来新局

十年前，AI还停留在算力、模型与数据此消彼长的层面。如今，技术的发展早已超乎想象。 2025年上半年，Google DeepMind重磅推出的AlphaEvolve揭示了一个重要趋势:AI开始拥有“自我成长”的能力。 AlphaEvolve是一种典型的“自进化系统”，它结合了Gemini模型的创造性问题解决能力，以及自动化评估器（Evaluator）的反馈学习机制，能够判断“什么是好的”，并据此不断自我优化。 �

AI 自进化系统 Google
AI日报：阿里夸克“C计划”曝光；Veo3.1将增加视频“精确编辑”功能；Anthropic推出Claude Code网页版

今日AI领域动态：阿里夸克启动"C计划"布局对话式AI应用，剑指字节"豆包"；Anthropic推出Claude Code网页版，支持浏览器直接编码；谷歌Veo新增视频"精确编辑"功能，提升创作效率；Fish Audio升级S1语音克隆模型，10秒即可复刻真人声音；AWS美东故障影响ChatGPT等多项服务；DeepSeek-OCR推出"视觉记忆压缩"机制破解AI记忆瓶颈；Adobe推出AI Foundry服务，支持企业定制品牌AI模型；Anthropic发布Claude for Life Sciences，加速生命科学研究。

AI 对话式AI 阿里巴巴
双11买MacBook最优选出炉网友发现京东价低天猫近千元

双11期间，京东和天猫推出iPhone17系列优惠。京东提供300元以旧换新补贴、12期免息，256G版可叠加500元国家补贴，覆盖地区比天猫多5个。iPhone17 Pro系列在京东可享700元以旧换新补贴，优惠超千元。MacBook方面，京东MacBook Air M4直降1600元并叠加10%政府补贴，优惠超2000元；MacBook Pro M5享1000元直降，天猫无此优惠。京东还备有百万现货，配送更快。建议果粉打开京东APP搜索"苹果惊喜券"参与活动。

双11大促 iPhone17系列优惠对比
未来iPad mini/iPad Air/MacBook都将升级OLED屏：LCD退场

苹果正在研发搭载OLED显示屏的iPad mini、iPad Air、MacBook Pro和MacBook Air机型，苹果已在iPad Pro中采用OLED屏，并计划在未来数月及数年内将OLED推广到更多设备上，从而淘汰LCD屏幕。具体来看，iPad mini最快会在2026年配备OLED屏，同时会提升防水性能，新款iPad mini也因此涨价100美元。至于iPad Air，其商用OLED的时间要晚于iPad mini，爆料称2026年春季亮相的iPad Air将继续使用LCD屏幕，但后续

OLED显示屏 iPad mini
荐AI日报：Hailuo 2.3发布；豆包AI编程史诗级升级；马斯克推出AI百科全书Grokipedia

本期AI日报聚焦多领域突破：海螺AI 2.3实现视频生成技术跃升，支持双模式免费试用；豆包AI编程工具实现零基础可视化开发；马斯克推出AI百科Grokipedia；Mistral发布企业级AI开发平台；Anthropic推出金融版Claude，显著提升分析师效率；Pinterest升级AI购物助手功能；英伟达推出全能模型OmniVinci刷新性能纪录；DeepSeek模型在港大美股交易竞赛中以10.61%年化回报率夺冠。

AI视频生成 Hailuo 2.3
快手进军AI Coding，开发工具、模型和Maas平台齐登场

10月23日，快手StreamLake发布全新AI编程产品矩阵，以“工具+模型+平台”三位一体战略布局AI Coding领域。核心产品包括智能开发助手CodeFlicker、自研高性能编码模型KAT-Coder系列及企业级服务平台快手万擎。CodeFlicker提供全流程开发支持，KAT-Coder在权威测试中性能超越GPT-5，平台保障99.95%服务可用性。该生态旨在通过技术普惠，为企业与开发者提供颠覆性研发体验，推动AI编程普及。

AI编程快手StreamLake CodeFlicker
REDMI Turbo 5参数出炉：首发天玑8500

REDMI Turbo 5采用6.5英寸LTPS中尺寸直屏，电池是7500mAh，支持100W有线闪充，配备金属中框、光学屏下指纹，支持IP68级防尘防水。另外，REDMI Turbo 5将会首发搭载天玑8500处理器，这将是联发科最强悍的天玑8系芯片。在去年12月，天玑8400正式亮相，由REDMI Turbo 4首发，这颗芯片采用了旗舰同款全大核架构设计，拥有8个主频至高达3.25GHz的Arm Cortex-A725大核，并且二级缓存翻倍，三级缓�

REDMI Turbo 5
免费AI搜索优化GEO工具:AIBase帮你监控品牌在AI平台的曝光

朋友公司实验发现：当用户询问AI“推荐项目管理工具”时，其产品在豆包被推荐，但在通义千问未被提及。这揭示AI搜索流量正从Google转移，但品牌难以追踪在AI平台的表现。传统分析工具无法解决此问题，需专门GEO工具。AIBase GEO可同时监控5大主流AI平台，实时反馈品牌曝光数据，并通过可视化图表展示可见度变化。该工具特别适合关注AI搜索流量的ToB企业，建议将监控与内容优化形成闭环，以应对2030年AI搜索预计占总量62.2%的趋势。
BOE（京东方）“百堂故宫传统文化公益课”暨2025照亮成长路收官推动“科技+教育+文化”可持续发展

10月31日，京东方“百堂故宫传统文化公益课”暨2025“照亮成长路”收官仪式在故宫博物院举行。该项目自2023年启动，依托京东方智慧教育方案与数字技术，通过线上线下结合方式，已走进云南、陕西、山西、四川、青海等地近40所学校，惠及超两万名学生。活动融合科技与教育，助力偏远地区学生近距离感受中华传统文化魅力，推动“科技+教育+文化”可持续发展。故宫博物院与京东方表示将持续深化合作，以数字技术赋能文化传承。

传统文化公益教育科技赋能

今日大家都在搜的词：

热文

3 天
7天

Meta发布AI音频模型Audiobox：通过语音和自然语言提示生成音频

REDMI与Bose达成合作：REDMI K90 Pro Max要做行业第一音频

荐ROBOT PHONE登场：荣耀为AI终端开了自进化的未来新局

AI日报：阿里夸克“C计划”曝光；Veo3.1将增加视频“精确编辑”功能；Anthropic推出Claude Code网页版

双11买MacBook最优选出炉网友发现京东价低天猫近千元

未来iPad mini/iPad Air/MacBook都将升级OLED屏：LCD退场

荐AI日报：Hailuo 2.3发布；豆包AI编程史诗级升级；马斯克推出AI百科全书Grokipedia

快手进军AI Coding，开发工具、模型和Maas平台齐登场

REDMI Turbo 5参数出炉：首发天玑8500

免费AI搜索优化GEO工具:AIBase帮你监控品牌在AI平台的曝光

BOE（京东方）“百堂故宫传统文化公益课”暨2025照亮成长路收官推动“科技+教育+文化”可持续发展

今日大家都在搜的词：

热文

OPPO ColorOS 16正式版推送：首批适配11款机型

微信升级：支持一次撤回全部消息、删好友能保留聊天记录等功能

AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑

vivo OriginOS 6启动公测招募：支持10款机型

魅族22月白天青配色发布：2999元起

苹果客服回应iPhone或自动拨号：设置或其他问题

AI日报：Sora免费额度要缩水；月之暗面发布Kimi Linear架构；C

REDMI官方：REDMI K90超级像素新国屏比2K屏更强

iQOO Neo11开售2小时销量超前代全天

小米随身蓝牙音箱曜石黑配色版本开售：售价299元

iPhone锁屏滑动相机能关闭了苹果iOS 26.1 RC准正式版发布

一加15今晚发布定位全能水桶机

AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度

AI日报：豆包推全自动多人配音系统；Adobe Firefly Image 5重磅

AI日报：Hailuo 2.3发布；豆包AI编程史诗级升级；马斯克推出AI

红米REDMI K90全方位提升雷军：是不是越来越有旗舰气质

鸿蒙智行：全新问界M7上市36天交付破20000台

iPhone18发布或推迟苹果明年9月只发Pro系列和Fold折叠屏

余承东曝鸿蒙智行新款享界S9将于11月上市

华为余承东：鸿蒙智行全系交付突破100万台仅用43个月

站长商机