首页 > 业界 > 关键词  > AudioSep最新资讯  > 正文

AudioSep:可以从音频剪辑中仅分离出特定的声音

2023-10-27 10:34 · 稿源:站长之家

站长之家(ChinaZ.com)10月27日 消息:AudioSep 是一种 AI 模型,可以使用自然语言查询进行声音分离。这一创新性的模型由Audio-AGI开发,使用户能够通过简单的语言描述来分离各种声音源。

通过使用AudioSep这一人工智能模型,我们可以从音频剪辑中精准地分离出特定的声音。举个例子,假设你在一个拥挤嘈杂的咖啡馆录制了一段音频,现在你可以从中剥离出对应的人声。这项技术支持本地部署,并且还提供了一个直观的用户界面,使操作更加简便。

image.png

项目地址:https://github.com/Audio-AGI/AudioSep

主要功能:

训练和微调: AudioSep提供了训练和微调模型以适应特定音频-文本配对数据集的工具。无论您在音频事件分离还是语音增强领域工作,此功能都使您能够为自己的独特需求定制模型。

推断: 利用AudioSep通过提供文本描述来进行音频分离。该模型以32kHz采样率处理音频,确保高质量的结果。您还可以直接从Hugging Face加载模型以方便使用。

内存效率: AudioSep提供基于块的推断,这是一种节省内存的选项,可以让您处理大型音频文件,而无需担心资源限制。

评估基准: 使用内置的基准工具来评估分离音频的性能。下载各种类别的评估数据,包括audioset、audiocaps、vggsound、music、clotho和esc50,并获得详细的结果。

引用: 如果您发现AudioSep有用,请考虑引用其背后的研究。承认开发者和研究人员为使这个工具可用所付出的辛勤工作是至关重要的。

AudioSep具有强大的分离性能和出色的零射击泛化能力,AudioSep为音频事件分离、乐器分离和语音增强等任务提供了广泛的应用。

举报

  • 相关推荐
  • 探营“数龙杯”参赛团队,Helix Studio努力打造互动影游2.0

    2023年互动剧《完蛋!我被美女包围了!》走红后,同类产品难现爆款。近期Helix Studio团队在数龙杯大赛推出AI驱动的沉浸式叙事影游《The Nightcap》,展现互动剧新形态。该作品整合NVIDIA ACE等前沿技术,实现虚拟角色与玩家深度互动;采用跨平台无缝体验设计,支持手机与VR设备切换;通过"有边界的自由空间"平衡剧情引导与玩家选择。团队表示AI技术使制作效率提升40-50%,未来计划推出UGC工具。作品融合影视与互动优势,用短片建立情感基础,以互动深化体验,同时通过信息冗余设计确保剧情理解完整性。虚拟音乐会采用"少而精"策略,与艺人深度合作打造独特数字演出体验。这一创新为互动剧行业提供了全新思路。

  • 如何用 DeepSeek 生成特定结构会议纪要

    本文介绍如何利用DeepSeek AI高效整理会议纪要。主要步骤包括:1)会议录音转文字(推荐使用"录咖"工具);2)登录DeepSeek官网输入指令,要求将会议记录按"决策事项/待办事项/风险预警"三部分结构化整理;3)检查优化生成的会议纪要。该方法能快速将杂乱会议内容转化为清晰文档,突出关键信息,提升工作效率。文中提供了具体操作流程和工具链接。

  • AI日报: ChatGPT免费开放记忆功能;华为WATCH 5智能手表接入双大模型;Claude Pro升级重磅功能

    本期AI日报主要报道了多项AI领域重要进展:1)OpenAI向所有ChatGPT用户免费开放记忆功能;2)蚂蚁集团推出"AI健康管家",服务4000万用户;3)Anthropic与DeepLearning.AI合作推出免费MCP课程;4)谷歌DeepMind开发无需3D模型即可生成逼真运动视频的新技术;5)Exa与OpenRouter合作为400+大模型提供实时网络搜索功能;6)中国知网推出CNKI AI学术研究助手;7)Anthropic推出Claude Explains博客项目;8)Claude Pro新增研究模式和远程MCP整合功能;9)Fish Audio发布基于200万小时数据训练的OpenAudio S1语音模型;10)OpenAI升级Codex编程工具;11)华为WATCH5接入盘古和DeepSeek双大模型。

  • 英语听力配音员露脸了:你一定听过他的声音

    据媒体报道,有博主在短视频平台上发布了一段英语听力测试视频,并配文你可能不认识我,但你一定听过我的声音”。 这段视频引发广泛关注,不少网友留言表示,终于见到素未谋面的仇人”了。 还有网友说,陪伴那么多届考生英语听力的人竟然是他,希望老师举办一场线下见面会。 在每年的高考英语考试中,听力测试是不可或缺的一环,听力考察的是学生听力能力和�

  • 丹麦拟定“深度伪造立法”,个人享有肖像、声音和形象所有权

    根据该法案,任何人若发现其肖像或声音被深度伪造并在未获授权的情况下使用,可依法要求删除相关内容……

  • 小鹏宣布将联手华为打造“世界上最好”的AR-HUD

    今日上午,小鹏汽车与华为乾崑智能汽车解决方案通过官方微博同步预告,双方将针对AR-HUD(增强现实抬头显示)领域存在的“看不清、头晕、遮挡”三大行业痛点展开深度合作,计划于6月5日14:30联合发布新一代技术解决方案。小鹏汽车在预告中强调:“行业变革从这一刻开始,看见未来,明天见!” 据双方发布的预告海报显示,华为XHUD增强现实抬头显示系统将首次搭载于小�

  • AI时代的营销答卷:淘宝天下摘得TopDigital桂冠

    淘宝天下凭借AI技术在营销领域的创新实践,在第十三届TopDigital创新营销盛典上斩获两项大奖。其获奖案例《淘宝蛇年"一起上春晚"云参演证互动传播》通过AIGC技术生成个性化"云参演证",结合明星联动和裂变式传播策略,实现超45亿曝光量,累计生成1.18亿张参演证,重塑了传统春节文化互动模式。同时,与神州租车合作的小米SU7 Ultra上新营销案例,通过头部KOL传播和社交化内容裂变,达成2.36亿+曝光量,获"社会化营销"铜奖。淘宝天下已布局AI驱动的全链路营销解决方案"淘天智家平台",支持从创意生成到多媒介内容生产的全流程,持续推动数字营销创新。

  • iOS 26、iPadOS 26支持机型一览,仅三款设备被“抛弃”

    并非所有设备都能继续获得支持,但对用户来说,今年的“牺牲名单”算是相对温和……

  • AI 购物,为什么难以戳中你的痛点?

    AI进入电商不是什么新鲜事。 对平台而言,AI正在成为电商的新质生产力。AI导购、数字人直播、AI换装等新场景,被电商大厂放进自己的App。降本增效的同时,或许能收获新的用户体验可能性。 但是,美好的可能性还过于遥远。对C端消费者而言,体感并不一定如平台所畅想的那么丝滑。 普通人对电商应用AI 最深刻的印象,恐怕就是机器人客服油盐不进的自动回复,彼此对�

  • 越打越长青,六年TOP1的射击游戏在8000万DAU新高后迎来了新舞台

    ​「有款游戏越打越年轻,就是手机和平精英。」 作为游戏圈的「梗王」,这句魔性的歌词传唱度十分之高。不同于一般手游上线即高峰、此后缓慢下滑的常态,已经上线六年的《和平精英》也是「越打越长青」,在2019年达到5000万日活后,六年之后再创新高,在2025年除夕,日活达成超8000万。 根据时代财经发布的《2025年5月中国常青游戏榜》,5月《和平精英》IOS端预估收入