首页 > 业界 > 关键词  > 微软最新资讯  > 正文

微软发布可逼真复制人脸和声音的 AI 工具,引发对加剧深度伪造的担忧

2023-11-20 17:09 · 稿源:站长之家

站长之家(ChinaZ.com) 11 月 20 日消息:在上周的开发者大会上,微软宣布了其在人工智能竞赛中的最新贡献:一款可以生成新头像和声音,或复制用户现有外观和语音的软件,这引发了人们对它可能加剧深度伪造创造的担忧。深度伪造是指使用 AI 制作的未曾发生事件的视频。

微软

在 2023 年的 Microsoft Ignite 大会上宣布的 Azure AI Speech,经过人类图像训练,允许用户输入脚本,然后可以由用人工智能创建的逼真头像「朗读」该脚本。用户可以选择预加载的微软头像,或上传他们想要复制其声音和相貌的人的录像。微软在上周三发布的博客文章中表示,该工具可用于构建「对话代理、虚拟助手、聊天机器人等」

文章中写道:「客户可以为他们的头像选择预建的或自定义的神经声音。如果用于自定义神经声音和自定义文本到语音头像的是同一个人的声音和相貌,头像将与那个人非常相似。」

微软表示,新的文本到语音软件发布时配备了多种限制和保护措施,以防止滥用。「作为微软对负责任 AI 的承诺的一部分,文本到语音头像的设计意图是保护个人和社会的权利,促进透明的人机互动,并抵制有害深度伪造和误导性内容的泛滥,」公司说。

「客户可以上传自己的 Avatar talent 的视频录像,该功能用于训练自定义头像说话的合成视频,」博客文章中写道。「 Avatar talent」是为 AI 的比喻性摄像机摆姿势的人。

该公告迅速引起批评,称微软发布了一个「深度伪造制造器」,这将更容易让一个人的相貌被复制并使其说出和做出该人未曾说过或做过的事情。微软自己的总裁在 5 月表示,深度伪造是他对人工智能崛起的「最大担忧」。

在一份声明中,微软公司对这些批评进行了反驳,称定制头像现在是一个「限制访问」的工具,客户必须申请并获得微软的批准。用户还将被要求披露在创建合成声音或头像时使用了 AI

微软的负责任 AI 工程部门的 Sarah Bird 在一份声明中说:「有了这些保障措施,我们有助于限制潜在风险,并使客户能够以透明和安全的方式将先进的语音和语音能力融入他们的 AI 应用。」

文本到语音头像制造工具是主要科技公司近年来抢占人工智能热潮的最新工具之一。在微软支持的公司 OpenAI 推出的 ChatGPT 大受欢迎后,像 Meta 和 Google 这样的公司也推出了自己的人工智能工具。

随着 AI 的兴起,人们越来越担心这项技术的能力,OpenAI 首席执行官 Sam Altman 警告国会,它可能被用于选举干预,必须实施保护措施。

专家表示,深度伪造在选举干预方面具有特别的危险性。微软本月早些时候推出了一款工具,允许政客和竞选活动认证和水印他们的视频,以验证其合法性并防止深度伪造的传播。Meta 本周宣布了一项政策,要求披露在政治广告中使用 AI 的情况,并禁止竞选活动使用 Meta 自己的生成 AI 工具进行广告。

举报

  • 相关推荐
  • 微软发布2025工作趋势:每位员工将是Agent老板

    微软发布《2025年工作趋势指数报告》,揭示"前沿公司"这一新型组织形态正在兴起。报告基于全球31个国家/地区的31,000家企业数据,结合LinkedIn劳动力市场趋势分析,指出"智能体+人类"的人机协作模式正在重塑企业架构。前沿公司以AI智能体为核心,通过动态任务协作图(WorkChart)取代传统职能架构,实现高效人机协作。报告显示:67%的领导者已熟悉智能体概念,79%认为AI将加速职业发展;员工需从"工具使用"转向"协作共创",掌握AI管理技能;组织需重构职能,建立"智能资源部门"统筹人力与数字劳动力分配。人机协作的关键在于科学管理框架,最优状态是AI处理标准化任务,人类专注战略指导与复杂决策。

  • 魅族Flyme 12系统提档至5月发布 深度融合AI技术

    星纪魅族官方宣布,原计划与魅族22系列共同发布的Flyme12系统将提前至5月中旬正式登场。此次系统升级不仅时间有所调整,其适配范围也进一步扩大,涵盖魅族21、20系列以及Lucky08等多款热门机型,旨在为用户带来更加丰富的智能体验。

  • MAXHUB打造AI+电脑,让办公从“人适应工具”到“工具服务人”

    数字化转型趋势下,企业正在思考,如何用人工智能重塑办公效率,“AI PC”的概念也成为计算机行业的热门话题。 4 月 16 日,InfoComm China2025 现场,MAXHUB发布全新一代AI+电脑,以AI技术为支点,重构结构与应用,实现办公范式革新。AI+PC深度融合,打造更懂用户的办公电脑传统的办公流程中,用户被迫消耗大量精力应对设备操作与运维琐事——整理散乱文档、转换文件格式、切

  • 麦德通AI外观检索工具怎么用?

    跨境电商卖家面临外观专利侵权风险,占比高达62%的侵权案件。麦德通推出AI外观检索工具,提供图片检索和关键词检索两种方式,3秒内精准匹配全球专利风险。首月限时免费使用,支持多图检索、智能联想功能,帮助卖家规避侵权风险。工具操作简单,非专业人士也能快速上手,可筛选有效专利结果。麦德通还提供商标检索等知识产权全链路服务,助力卖家提高品牌注册成功率。

  • AI日报:字节发布豆包1.5深度思考模型;微信首个AI助手 “元宝” 上线;OpenAI发布o4-mini、满血版o3

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、OpenAI发布两款多模态推理模型o4-mini、满血版o3OpenAI在技术直播中推出了其最新的多模态模型o4-mini和满血版o3,这两款模型具备同时处理文本、图像和音频的能力,并能调用外部工�

  • 雷军愿望成真:AI换脸、声音克隆假冒企业家将被重点整治

    快科技4月30日消息,近日,中央网信办印发通知,在全国范围内部署开展为期3个月的清朗整治AI技术滥用”专项行动。其中,利用AI假冒他人实施侵权违法行为的将被重点整治。包括通过AI换脸、声音克隆等深度伪造技术,假冒专家、企业家、明星等公众人物,欺骗网民,甚至营销牟利。去年国庆假期,就曾有人用AI捏造雷军配音,从吐槽假期到骂人,各种内容应有尽有。这让雷军非常困扰,发视频呼吁大家不要再恶搞。今年3月,小米集团创始人、董事长兼CEO雷军在2025全国两会上将提出5项建议。其中就有关于加强AI换脸拟声”违法侵权重灾区治理的建议?

  • 火山引擎即将发布深度思考模型

    据悉,字节跳动旗下云服务平台火山引擎即将发布豆包深度思考模型。有消息称,豆包APP和桌面端的“深度思考模式”已进行了多个实验版本的测试,而此次发布后,该模型将正式面向企业提供服务。目前,豆包大模型家族已覆盖全模态、全场景,包括大语言模型、语音大模型,以及图像、视频等视觉大模型,企业可以通过火山引擎使用豆包大模型API服务。IDC最新发布的《中�

  • 深度deepin 23.1正式发布AI默认引擎切换至DeepSeek、修复超百项问题

    快科技4月16日消息,今天,深度操作系统宣布,deepin 23.1版本已正式发布。此版本聚焦于解决基础组件更新后的安装效率问题,大幅提升新用户安装体验,同时集成多项功能优化与问题修复,进一步优化系统使用。本次版本的重点改进包括内核优化、AI 默认引擎切换至DeepSeek、修复超百项用户反馈问题等,具体重点改进如下:硬件兼容性与内核优化:集成6.6/6.12内核更新、NVIDIA显卡驱动升级、Intel/AMD CPU微码更新,全面提升硬件支持与底层性能;核心功能增强:DDE新增智能镜像源管理、紧凑模式入口,全局搜索支持离线自然语言与AI处理能力;?

  • 能理解海豚声音!谷歌开发全新AI模型DolphinGemma

    快科技4月15日消息,谷歌公布了一款名为DolphinGemma”的大型语言模型,旨在帮助科学家理解海豚的声音,并生成类似海豚的声音序列。研究人员预计在未来几个月内测试DolphinGemma及其配套的Cetacean Hearing Augmentation Telemetry(CHAT)发声系统,以探索是否能够翻译并模仿海豚的声音,进而实现与海豚的某种对话”。海豚是地球上最聪明且最善于沟通的动物之一,其社交互动极其复杂�