AudioSep：可以从音频剪辑中仅分离出特定的声音

2023-10-27 10:34 · 稿源：站长之家

站长之家（ChinaZ.com）10月27日消息:AudioSep 是一种 AI 模型，可以使用自然语言查询进行声音分离。这一创新性的模型由Audio-AGI开发，使用户能够通过简单的语言描述来分离各种声音源。

通过使用AudioSep这一人工智能模型，我们可以从音频剪辑中精准地分离出特定的声音。举个例子，假设你在一个拥挤嘈杂的咖啡馆录制了一段音频，现在你可以从中剥离出对应的人声。这项技术支持本地部署，并且还提供了一个直观的用户界面，使操作更加简便。

项目地址:https://github.com/Audio-AGI/AudioSep

主要功能:

训练和微调: AudioSep提供了训练和微调模型以适应特定音频-文本配对数据集的工具。无论您在音频事件分离还是语音增强领域工作，此功能都使您能够为自己的独特需求定制模型。

推断: 利用AudioSep通过提供文本描述来进行音频分离。该模型以32kHz采样率处理音频，确保高质量的结果。您还可以直接从Hugging Face加载模型以方便使用。

内存效率: AudioSep提供基于块的推断，这是一种节省内存的选项，可以让您处理大型音频文件，而无需担心资源限制。

评估基准: 使用内置的基准工具来评估分离音频的性能。下载各种类别的评估数据，包括audioset、audiocaps、vggsound、music、clotho和esc50，并获得详细的结果。

引用: 如果您发现AudioSep有用，请考虑引用其背后的研究。承认开发者和研究人员为使这个工具可用所付出的辛勤工作是至关重要的。

AudioSep具有强大的分离性能和出色的零射击泛化能力，AudioSep为音频事件分离、乐器分离和语音增强等任务提供了广泛的应用。

（举报）

相关推荐

关键词：

AudioSep

华为FreeBuds Pro 5悦彰耳机价格公布：1449元支持星闪音频

华为于11月18日宣布FreeBuds Pro5悦享耳机开启预售，首发价1449元，11月25日正式开售。作为行业首款支持星闪音频的无线耳机，搭载麒麟A3芯片与星闪2.0技术，实现4.6Mbps高速传输和96kHz/24bit无损音质。采用双路独立驱动设计，配备双频灵犀天线，降噪效果提升220%，续航达6小时（降噪开启）或9小时（关闭）。支持HarmonyOS多设备连接、AI录音转写等实用功能，提供便捷体验。

华为FreeBuds Pro5 星闪音频
颠覆Diffusion局限！Utopai双模型耦合架构，攻克AI影视长叙事核心难题

Utopai Studios推出专为影视制作设计的AI模型与工作流，区别于主流视频生成模型，其核心能力在于理解剧本、规划镜头及生成场景，通过自回归模型负责叙事规划与一致性约束，扩散模型专注高质量画面渲染。该系统能解决跨镜头元素漂移难题，提升制作效率与作品品质。目前工作流仅用于公司自有项目，强调AI作为创作者协作者的角色，并遵循行业道德与版权规范。

AI影视制作 Utopai Studios
荐AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异常致全球宕机；百度Q3 AI收入96亿元

谷歌发布Gemini 3大模型及Antigravity AI开发平台，支持参数灵活调整；Cloudflare因配置异常致全球服务中断6小时；微软测试AI文件连接器，允许Claude直接读取本地文件；百度Q3 AI收入96亿元，萝卜快跑订单激增；小米AI眼镜新增直播与语音控制功能；TikTok推出AI内容推荐调节选项；微软将Copilot全面集成至Office应用；谷歌推出实时生成交互界面的Generative UI技术；Manus发布Browser Operator，将浏览器升级为全功能AI代理。

AI Gemini 3
PayInOne携智能AI招聘产品Foundire亮相进博会，创新科技步履不停

第八届中国国际进口博览会于2025年11月5日至10日在上海成功举办。全球招聘与薪酬管理平台PayInOne在服务贸易展区亮相，重点展示其AI驱动的智能招聘平台Foundire，该平台通过人才画像匹配、自动化筛选及智能评估体系，显著提升跨境招聘效率与精准度。CEO林坦在专题演讲中强调AI技术正推动用工模式变革，助力企业实现全球化高效合规管理。展会期间，PayInOne联合多家生态伙伴举办多场活动，探讨企业出海机遇，并与政府、企业界嘉宾深入交流，巩固了其在全球人力资源服务领域的行业领导地位。

智能招聘薪酬支付跨境用工合规
剪辑快人一步！索尼ICE-Cloud助力婚礼视频团队高效高质交付

北京二十四格文化有限公司（24Frames）成立于2004年，专注极致纪实影像美学，深耕婚礼电影、商业宣传、纪录片、综艺及艺人合作等领域。团队以真实事件与情感为核心，融合高级审美与技艺，打造富有共情力的影片，助力品牌传递深度价值。面对跨地域协作与高清素材传输等挑战，公司通过索尼与分秒帧联合推出的ICE-Cloud云平台优化流程，实现拍摄至交付的高效协同，显著�

婚礼视频拍摄纪实影像美学商业宣传片
EUDR认证大概需要多少钱？绿舟为您带来费用详解

欧盟《零毁林法案》(EUDR)将于2025年底实施，中国出口企业面临合规挑战。认证成本因企业规模、供应链复杂度而异，中小型企业费用约数万元，大型企业可达数十万元。核心支出包括供应链追溯、风险评估及第三方审核。案例显示认证橡胶原料溢价达200美元/吨，但长期可通过价格溢价抵消部分成本。建议企业提前规划，采用区块链等技术提升追溯效率，并争取将中国列为低风险国家以简化流程。合规虽增加短期成本，却是提升国际竞争力和供应链转型的契机。

EUDR认证欧盟零毁林法案绿色通行证
绿舟EUDR合规已成功交付！4周完成，领先行业！

绿舟成为行业首批成功交付欧盟零毁林法规(EUDR)合规申报的服务商，最快4周完成合规，率先提供全流程服务。距法规执行仅剩两个月，绿舟凭借专业团队、标准化流程和全链路支持，帮助企业快速应对合规挑战，规避货物扣留、高额罚款等风险，抢占欧盟市场先机。

EUDR合规跨境贸易环保合规
如何证明企业已满足EUDR认证要求？绿舟带来三大核心要素解析

欧盟《零毁林法案》(EUDR)将于2025年底全面实施，企业需通过完整体系证明合规性。核心要求包括：建立可追溯的供应链数据，记录产品从原料到成品的完整路径；开展尽职调查，涵盖风险评估、缓解措施及持续监控记录；向欧盟提交附证明文件的尽职调查声明。企业需建立常态化监控机制，并保存数据至少五年。建议采用卫星遥感、区块链等技术提升数据透明度，借助现有认证体系降低成本。系统性合规不仅是法律要求，更是企业赢得欧盟市场竞争优势的关键起点。

欧盟零毁林法案 EUDR合规供应链可追溯性
Qwen用开源逆袭GPT的故事，千问APP要再干一遍

Qwen模型逆袭GPT的策略，阿里准备再用一次。 2018年，OpenAI发布了自己的第一个模型GPT1，占据了技术先机，随后变得越来越封闭。在大洋彼岸，阿里几乎同一时间着手大模型研究，到2023年推出“通义千问”时，则选择了一条完全不同的路径:直接开源模型，允许开发者免费使用、改进和集成。这个策略让Qwen逐步积累起规模，做到了如今全球开发者基于它发布了17万个衍生模型�

文章搜索核心标签硅星人Pro
荐1人开发2个月，8000元成本拿到破万DAU：年轻人的机会来了？

如今用AI做游戏不稀奇，用AI做AI游戏也不稀奇，在B站上你可以搜到一大堆相关的内容。但最近葡萄君发现了一款有点特别的游戏:《妹居物语》。这款游戏的卖相属实不算好:简陋的UI、朴素的立绘、单调的场景......与其他同类产品利用AI低成本地创造刺激视觉效果的做法完全不一致。

AI游戏妹居物语游戏开发

今日大家都在搜的词：

热文

3 天
7天

AudioSep：可以从音频剪辑中仅分离出特定的声音

华为FreeBuds Pro 5悦彰耳机价格公布：1449元支持星闪音频

颠覆Diffusion局限！Utopai双模型耦合架构，攻克AI影视长叙事核心难题

荐AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异常致全球宕机；百度Q3 AI收入96亿元

PayInOne携智能AI招聘产品Foundire亮相进博会，创新科技步履不停

剪辑快人一步！索尼ICE-Cloud助力婚礼视频团队高效高质交付

EUDR认证大概需要多少钱？绿舟为您带来费用详解

绿舟EUDR合规已成功交付！4周完成，领先行业！

如何证明企业已满足EUDR认证要求？绿舟带来三大核心要素解析

Qwen用开源逆袭GPT的故事，千问APP要再干一遍

荐1人开发2个月，8000元成本拿到破万DAU：年轻人的机会来了？

今日大家都在搜的词：

热文

华为Mate X7外观公布搭载全新折叠玄武架构

AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；

董明珠再回应玫瑰空调：创新尝试打造家电艺术品

华为Mate X7今日开启预订搭载第二代红枫影像等配置

苹果回应iPhone17PM被湿巾擦掉色：高浓度酒精或是诱因

参与开发iPhoneAir设计师离职转投AI初创公司

AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异

华为FreeBuds Pro 5悦彰耳机价格公布：1449元支持星闪音频

小米端到端辅助驾驶“Xiaomi HAD增强版”将于11月12日发布

小米AI眼镜推出1.4.16.0固件版本支持英语口语陪练

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

华为Mate 80/Pro/Pro Max/RS开启预约：全系直屏设计

AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大

华为Mate X7外观公布搭载全新折叠玄武架构

阿里巴巴回应千问崩了：状态良好欢迎来问

AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；

荣耀500系列官宣将于11月24日发布

小米超级小爱AI大模型推出随心修图功能

一加Ace 6T官宣将于本月发布：首发骁龙8 Gen5

站长商机