首页 > 业界 > 关键词  > AudioSep最新资讯  > 正文

AudioSep:可以从音频剪辑中仅分离出特定的声音

2023-10-27 10:34 · 稿源:站长之家

站长之家(ChinaZ.com)10月27日 消息:AudioSep 是一种 AI 模型,可以使用自然语言查询进行声音分离。这一创新性的模型由Audio-AGI开发,使用户能够通过简单的语言描述来分离各种声音源。

通过使用AudioSep这一人工智能模型,我们可以从音频剪辑中精准地分离出特定的声音。举个例子,假设你在一个拥挤嘈杂的咖啡馆录制了一段音频,现在你可以从中剥离出对应的人声。这项技术支持本地部署,并且还提供了一个直观的用户界面,使操作更加简便。

image.png

项目地址:https://github.com/Audio-AGI/AudioSep

主要功能:

训练和微调: AudioSep提供了训练和微调模型以适应特定音频-文本配对数据集的工具。无论您在音频事件分离还是语音增强领域工作,此功能都使您能够为自己的独特需求定制模型。

推断: 利用AudioSep通过提供文本描述来进行音频分离。该模型以32kHz采样率处理音频,确保高质量的结果。您还可以直接从Hugging Face加载模型以方便使用。

内存效率: AudioSep提供基于块的推断,这是一种节省内存的选项,可以让您处理大型音频文件,而无需担心资源限制。

评估基准: 使用内置的基准工具来评估分离音频的性能。下载各种类别的评估数据,包括audioset、audiocaps、vggsound、music、clotho和esc50,并获得详细的结果。

引用: 如果您发现AudioSep有用,请考虑引用其背后的研究。承认开发者和研究人员为使这个工具可用所付出的辛勤工作是至关重要的。

AudioSep具有强大的分离性能和出色的零射击泛化能力,AudioSep为音频事件分离、乐器分离和语音增强等任务提供了广泛的应用。

举报

  • 相关推荐
  • AI日报:阿里夸克“C计划”曝光;Veo3.1将增加视频“精确编辑”功能;Anthropic推出Claude Code网页版

    今日AI领域动态:阿里夸克启动"C计划"布局对话式AI应用,剑指字节"豆包";Anthropic推出Claude Code网页版,支持浏览器直接编码;谷歌Veo新增视频"精确编辑"功能,提升创作效率;Fish Audio升级S1语音克隆模型,10秒即可复刻真人声音;AWS美东故障影响ChatGPT等多项服务;DeepSeek-OCR推出"视觉记忆压缩"机制破解AI记忆瓶颈;Adobe推出AI Foundry服务,支持企业定制品牌AI模型;Anthropic发布Claude for Life Sciences,加速生命科学研究。

  • ​畅玩《战地6》,双11电脑DIY装机配置推荐

    双11期间恰逢《战地6》等热门游戏发布,是升级主机的绝佳时机。推荐一套专为FPS电竞优化的硬件组合:AMD锐龙7 9800X3D处理器凭借大缓存实现帧率爆发,技嘉B850M电竞主板配备一键超频与散热技术确保稳定输出,搭配技嘉RTX 5070魔鹰显卡支持DLSS4技术,游戏帧率最高提升6倍。三款产品性能超值,组合购买享优惠,注册后更享4年质保与免费维修服务。

  • 浅醺猫DIY鸡尾酒获20亿战略投资

    中国夜间经济正迎来结构性升级,2025年规模预计突破5.2万亿元,Z世代消费占比达52%,推动场景向沉浸式、科技化转型。在此背景下,创新品牌“浅酩猫DIY”完成20亿元战略投资,启动“全国万店工程”,以AI智能柜为核心构建微醺消费新生态。该模式结合无人零售与DIY调酒,单柜日均销量较传统便利店提升3倍,计划2026年布局10万点位,目标2028年冲击百亿美元市值。品牌通过跨

  • 年轻人DIY服装200元做出大牌同款 网友:真正的私人高定

    在商场里一件标价上千元的连衣裙,如今年轻人只需花200元就能自制出同款,这样的“价格差”正吸引着越来越多年轻人走进布料市场,亲手开启DIY服装的潮流。近日,这一现象在网络和现实中引发广泛关注。 自制服装不仅能省钱,还能满足年轻人对独特风格的追求。有年轻人表示,自己做衣服能获得独一无二的风格,绝对不会跟别人重样,这才是真正的私人高定。同时,一

  • AI日报:Hailuo 2.3发布;豆包AI编程史诗级升级;马斯克推出AI百科全书Grokipedia

    本期AI日报聚焦多领域突破:海螺AI 2.3实现视频生成技术跃升,支持双模式免费试用;豆包AI编程工具实现零基础可视化开发;马斯克推出AI百科Grokipedia;Mistral发布企业级AI开发平台;Anthropic推出金融版Claude,显著提升分析师效率;Pinterest升级AI购物助手功能;英伟达推出全能模型OmniVinci刷新性能纪录;DeepSeek模型在港大美股交易竞赛中以10.61%年化回报率夺冠。

  • 快手进军AI Coding,开发工具、模型和Maas平台齐登场

    10月23日,快手StreamLake发布全新AI编程产品矩阵,以“工具+模型+平台”三位一体战略布局AI Coding领域。核心产品包括智能开发助手CodeFlicker、自研高性能编码模型KAT-Coder系列及企业级服务平台快手万擎。CodeFlicker提供全流程开发支持,KAT-Coder在权威测试中性能超越GPT-5,平台保障99.95%服务可用性。该生态旨在通过技术普惠,为企业与开发者提供颠覆性研发体验,推动AI编程普及。

  • 超擎速度!全国首批NVIDIA DGX Spark率先抵达超擎数智,现货在仓,交付启动

    10月19日,全国首批NVIDIA DGX Spark桌面级AI超算率先抵达超擎数智并开始交付。这款"全球最小AI超算"在发布72小时内落地中国市场,为企业和科研机构提供强劲算力。产品预装完整AI软件栈,实现开箱即用,配备详细快速指南和专业支持团队,助力开发者无缝对接顶尖计算能力,加速AI本地化开发创新。

  • 1人开发2个月,8000元成本拿到破万DAU:年轻人的机会来了?

    如今用AI做游戏不稀奇,用AI做AI游戏也不稀奇,在B站上你可以搜到一大堆相关的内容。 但最近葡萄君发现了一款有点特别的游戏:《妹居物语》。 这款游戏的卖相属实不算好:简陋的UI、朴素的立绘、单调的场景......与其他同类产品利用AI低成本地创造刺激视觉效果的做法完全不一致。

  • M6 iPad Pro将加入VC散热:向iPhone 17 Pro看齐

    随着芯片性能的不断提升,苹果计划为iPad Pro配备VC散热系统,消费者最快会在M6 iPad Pro上看到。 Mark Gurman指出,如果iPhone与iPad Pro配备VC散热系统的尝试取得成功,苹果后续可能会将该技术应用到MacBook Air等其他被动散热设备上。 目前苹果对iPad Pro的更新周期约为18个月,因此下一代iPad Pro预计将在2027年春季发布。

  • 解锁音频新维度 OZO Audio邀你享极致视听体验

    2018 年 11 月 28 日下午,诺基亚OZO媒体沟通体验会在北京举办。诺基亚媒体技术事业部业务副总裁Paul Melin,诺基亚媒体技术事业部产品与技术策略主管Jyri Huopaniemi以及诺基亚媒体技术事业部营销主管Paramita Bhattacharya,带来了一场精彩的技术分享与产品体验会。诺基亚OZO媒体沟通体验会诺基亚OZO是一场音频、图像和视频技术的变革,承载着诺基亚长久以来的创新传统。OZO技术包括OZO Audio和HEIF解决方案,可深入细致地捕捉并

今日大家都在搜的词: