首页 > 业界 > 关键词  > Deepfake最新资讯  > 正文

Meta开发AudioSeal技术,可以秘密为 Deepfake 音频添加水印

2024-02-04 14:38 · 稿源:站长之家

**划重点:**

1. 🌐 Meta的研究人员开发了一种方法,在人工智能生成的语音中隐形水印,可用于主动检测AI生成的言论,识别生成它的模型。

2. 🚀 Facebook Research提出的AudioSeal技术通过水印标记AI生成的语音,以解决对抗合成语音的检测问题,具有高精度和鲁棒性。

3. ⚠️ 虽然AudioSeal是一项重要进展,但仍需谨慎应用,以克服隐私和伦理风险,同时也强调需要不断演进的解决方案以确保对抗合成媒体的可靠性和合法性。

站长之家(ChinaZ.com)2月4日 消息:近期,Meta的研究人员在对抗合成语音的挑战中取得了一项重大突破。他们提出了一种名为AudioSeal的技术,该技术能够在人工智能生成的语音中嵌入隐形水印,用于主动检测AI生成的言论,同时还能够识别生成它的具体模型。

人工智能语音合成技术的迅速发展使得虚构的人类语音变得极为逼真。然而,这也引发了对声音克隆、深度伪造和其他形式的音频操纵的担忧。为了有效区分真实录音和音频深度伪造,需要强大的新型检测方法。在这篇文章中,我们将介绍来自Facebook Research的一种新颖技术,名为AudioSeal,它通过在AI生成的语音中嵌入隐形水印来解决这一问题。

image.png

传统的检测虚构音频的方法通常采用被动分析,即训练分类器识别真实和合成语音之间的统计差异。然而,随着合成系统变得越来越先进和自然,被动检测在未来可能会变得不够可靠。因此,需要采用主动水印技术,直接在AI生成的音频中嵌入信号。

AudioSeal具有两个关键组成部分:生成器和检测器。生成器将隐形水印嵌入由语音合成模型产生的音频中,而检测器则分析音频剪辑,精确定位包含水印的区域,从而识别AI生成的部分。

与先前的音频水印技术相比,AudioSeal在多个方面取得了显著的改进。它具有广泛适用性,只需训练一次即可适用于任何模型或语言,实现了对模型身份消息的扩展,同时保持高鲁棒性。此外,其高效的检测速度使其在实时和大规模筛查方面表现出色。

然而,尽管AudioSeal具有令人期待的优势,对其负责任的应用仍需谨慎。该技术依赖于保持检测器的机密性和对抗不同攻击的鲁棒性,以防止恶意行为者识别并移除水印。此外,水印技术可能涉及一些伦理风险,如大规模监控,因此可能需要跨不同供应商标准化,以避免竞争升级。

AudioSeal是解决检测AI生成音频挑战的一项创新技术。通过隐形水印合成语音,AudioSeal提供了局部检测,即使合成模型快速演进,也能保持高度鲁棒。然而,随着威胁形势的变化,更好的解决方案仍需要不断发展,以识别操纵风险并在人工智能能力不断增强的背景下建立对语音界面的信任。

举报

  • 相关推荐
  • 一年了 美国还在追着抹黑!曝DeepSeek春节再扔王炸 最新披露

    一年了,美国还在追着Deepseek抹黑,可中国最新的Seedance都2.0了。中国视频生成模型Seedance2.0吸引全球目光时,当地时间2月12日,美国人工智能公司OpenAI向美国众议院提交了一份备忘录,再次抹黑中国人工智能大模型DeepSeek,称其抄袭”了美国的大模型。DeepSeek的下一代模型V4或将在今年春节前后正式发布。

  • DeepSeek突发更新:不是V4但惊喜很多 编程实测来了

    DeepSeek于2月11日悄然更新模型,主要提升上下文能力至1M,可一次性处理《三体》三部曲等超长文本。官方强调这是最新模型,未命名特定子版本。实测显示其在编程、物理模拟等多方面能力均有提升,甚至超越此前所有版本达到SOTA水平。不过,新模型在部分具体问题(如50米距离洗车方式)上回答不一致,其是否为完整版尚不确定。

  • 提升7倍 DeepSeek官宣测试全新大模型:或为V4 Lite

    前几天国产AI来了一波爆发,智谱GLM-5、Minimax2.5及DeepSeek在11日同一天都发布了新的大模型,其中DeepSeek的自然最受关注。此前我们已经报道过了,这次更新主要是提升了上下文能力,达到了1M之前的DeepSeeV3系列也就是128K,这方面相对前代V3系列大模型提升了7倍。传闻中的DeepSeekV4满血版是1.5万亿参数,比V3系列翻倍还多会使用之前DeepSeek研究的Engram、mHC等新技术,性能全面提升的同时成本还低,这个期待值还是很高的。

  • DeepSeek回应被指变冷淡:已收到反馈 为平衡效率与情感

    DeepSeek近期技术升级后,其AI助手风格从“细腻共情”转向“公事公办”,引发用户争议。部分用户认为新版更理性客观,能专注问题本身;也有人批评其语气疏离、缺乏温度。官方解释称,调整旨在提升信息密度与响应效率,并为2026年V4版本进行极限压力测试。这表明AI在拟人化与功能性之间寻求平衡,不同用户对交互风格存在差异化需求。

  • DeepSeek更新上下文达百万级token:可一次性处理超长文本

    DeepSeek近日在网页端及APP端完成版本更新,正式将上下文窗口扩展至1M(百万) Token,迎来对话容量的显著跃升。 相较于去年8月发布的DeepSeek V3.1所支持的128K上下文,新实装模型的上下文能力较两个月前更新的V3.2提升达八倍。 网友实测显示,DeepSeek已可一次性处理《三体》三部曲体量的超长文本,并在问答中明确表示其知识截止日期更新至2025年5月。

  • AI日报:Anthropic发布Claude Opus 4.6;千问“春节大免单”首日火爆;腾讯推出“火龙漫剧”

    本期AI日报聚焦行业热点:阿里千问“春节30亿免单”活动火爆,其分享口令在微信内遭复制限制,腾讯元宝App也面临类似困境,引发平台间“围墙”博弈争议。360推出国内首个工业级AI漫画生产平台,提升创作效率与一致性。市监总局公布5起AI领域不正当竞争典型案例,打击仿冒、虚假宣传等行为。OpenAI发布Frontier平台,旨在打造“AI同事”生态,加速企业级智能体落地。腾讯�

  • 为国产模型和国产芯片造“桥”:昇腾平台上的DeepSeek-OCR-2迁移实录

    文章讲述了使用智子芯元KernelCAT工具,将DeepSeek-OCR-2模型高效迁移至华为昇腾Atlas A2国产芯片的过程。传统迁移需人工处理代码依赖、环境配置和算子优化,耗时费力。而KernelCAT作为AI Agent,能自动分析代码、适配环境、生成补丁,并将通用计算逻辑替换为针对国产硬件的优化实现,最终将推理速度从15 tokens/s大幅提升至550.45 tokens/s,加速超35倍。这展现了未来开发范式:人类定义目标,AI自主解决路径,让开发者从底层适配的繁琐工作中解放出来。

  • 苹果创意生产力全家桶Apple Creator Studio上线:订阅制 每月38元

    苹果公司宣布,Apple Creator Studio在全球全球范围内正式上线,采用订阅制付费,每月38元或每年380元,新用户可享一个月免费试用。 高校师生专享教育优惠价每月18元或每年180元,已购Mac设备用户可免费试用三个月;通过家人共享,最多6名家庭成员可共享全部应用与内容。 这是苹果首次推出的创意应用订阅套装,整合视频剪辑、音乐制作、图像设计与办公生产力工具,包含Mac

  • AI日报:字节发布Seedream5.0Lite;小红书不标AI将限流;美图开拍首批接入Seedance 2.0大模型

    本期AI日报涵盖多项重要动态:字节跳动发布具备视觉推理与实时联网能力的图像创作模型Seedream5.0Lite;小红书要求AI生成内容须显著标识;美图工具“开拍”接入Seedance 2.0大模型以提升视频创作效率;OpenAI在ChatGPT中上线广告业务以应对成本压力;OpenAI与Cerebras合作推出专为实时编程优化的GPT-5.3-Codex-Spark;蚂蚁集团开源全球首个基于混合线性架构的万亿参数思考模型Ring-2.5-1T;Google发布在编程与科研领域实现突破的Gemini 3 Deep Think;同程旅行全面接入腾讯元宝,通过AI实现秒级行程规划与预订。

  • 国产AI让普通人也能当导演 字节Seedance 2.0获央视点赞

    日前,字节跳动新一代视频生成模型Seedance2.0上线。该模型凭借导演级叙事能力与零门槛操作,不仅让普通人也能轻松创作电影级视频,更获央视财经的点赞,称其改变电影制作生态,让中国AI技术惊艳世界。”在国外同样广受关注,马斯克在X平台转发评论发展得太快了”,美国导演感叹好莱坞要被AI颠覆!

今日大家都在搜的词: