首页 > 业界 > 关键词  > 纸钞屋最新资讯  > 正文

人工智能公司开发全新语音合成技术 或能帮助解决外语片配音问题

2022-01-20 16:00 · 稿源: cnbeta

据AXIOS报道,一些AI公司正在开发解释和合成广告、电影和电视中的声音的方法。语音合成方面的进展可以帮助解决糟糕的外语片配音问题--它们的出现是因为作为娱乐全球化的一部分,国际内容对电影公司和流媒体平台变得越来越重要。

K{BT{ZGV{$T]`{93E}X9X]T.png

但它们引起了人们对深层伪造音频的可能性以及名人的声音在他们死后可能被使用的担忧。

像《鱿鱼游戏》和《纸钞屋》这样的外语片正在吸引创纪录的观众,但对于试图开拓日益增长的国际市场的电影公司来说,字幕仍然是一块绊脚石。

例如,观看《鱿鱼游戏》配音版的Netflix用户比观看字幕版的用户多。由于大片占用了大量带宽,小型外语内容生产商很难找到足够的翻译和配音演员来满足需求。

人工智能公司Veritone的联合创始人兼总裁Ryan Steelberg说:“我们仍然停留在一对多的广播模式的思维模式中。”Veritone开发了一个名为MARVEL.ai的产品,允许内容制作者生成和授权其所谓的“超现实”合成声音。

这意味着,例如,播客创作者可以将音频广告文案解释为另一种语言,然后MARVEL.ai将生成一个合成版本的声音,用新的语言阅读广告。

Steelberg说:“它让你有能力以更大的规模和更低的成本对音频进行超个性化处理。”

文字转语音技术已经存在了几十年,但Veritone的产品使用了“语音转语音”,Steelberg称之为“语音即服务”。

Veritone可以访问来自媒体库的PB级数据,并利用这些数据来训练其人工智能产品,创建一个原始语音的合成版本,可以针对不同类型的情感或情绪进行调整,或者通过翻译,说出一种外语。

“它不再是另一个人的新声音,例如代表汤姆·克鲁斯说话,”Steelberg说。“这真的将是用汤姆·克鲁斯的声音来说另一种语言。”

NVIDIA一直在开发技术,允许人工智能改变视频或动画的方式,将演员的嘴唇和面部表情与新的语言相匹配--因此将不再有20世纪70年代的电影中那种不同步的配音。这项技术可能会首先用于广告,但随着它向更高质量的内容迁移,它将为明星人才带来潜在的机会和陷阱。

Steelberg说:“在配音和后期制作方面,合成声音将成为主流,你会看到这一点被纳入人才合同。”

这不仅仅是为了确保好莱坞明星(和他们的经纪人)在使用他们的合成声音时获得分成,而且也是为了防止这些声音在技术越来越普及的情况下被劫持用于恶性目的。

值得关注的是,已故名人的声音和其他创造性属性将如何被人工智能所利用?

弗兰克·扎帕等已故音乐家的全息影像已经被用于“现场”表演,带来了数千万的收入,而Kenny G最近发布了与30年前去世的爵士乐大师Stan Getz的“二重奏”。Getz现有资料库中的样本音频资料被用来生成一个新的、合成的旋律--尽管这个旋律被爵士乐作家Ted Gioia称为“Frankenstein唱片”。

举报

  • 相关推荐
  • Neuralink突破全球12例植入!微美全息(WIMI.US)构建脑机生态步入新阶段!

    马斯克旗下Neuralink宣布全球已有12人植入脑机接口设备,累计使用超2000天。该公司自2024年获FDA批准后开展人体试验,计划未来六年运营五家诊所并推出三类植入设备。脑机接口技术不仅用于治疗神经疾病,还探索人机融合增强人类能力。全球市场规模预计2025年达19.5亿美元,医疗康复和消费级应用成为主要增长点。该技术正从科幻走向现实,推动精准医疗和智能交互发展。

  • 亚马逊入局竞逐AR眼镜行业,Meta/谷歌/微美全息以“硬件+生态”双赛道策略领先

    亚马逊正加速布局AR眼镜市场,开发两款产品:面向物流司机的"Amelia"和面向消费者的"Jayhawk"。科技巨头纷纷入局,Meta、谷歌、苹果等均在研发相关产品。中国消费级AR眼镜市场2025年上半年增长显著,销量达26.2万台,同比增长73%。行业预计未来三年规模有望达千亿级别,AR眼镜正从"小众玩具"迈向"大众智能终端"。

  • 小米17全系搭载全新M10屏幕发光技术

    小米17系列手机于9月23日正式发布,全系标配全新M10屏幕发光技术,采用国产新型红色发光材料,发光效率高达82.1cd/A,直逼行业最高水平。设计上采用超椭圆R角设计,边框窄至1.18mm,视觉震撼。标准版配备6.3英寸小尺寸直屏,重量仅191g,单手操作无压力。Pro和Pro+创新引入“妙享背屏”,支持自定义显示内容及自拍预览,提升便捷性与趣味性。核心配置首发骁龙8 Elite Gen5平台,安兔兔跑分突破400万,性能强劲。小米总裁卢伟冰透露背屏研发成本高达10亿元,彰显技术投入决心。

  • 免费, 是影像SaaS的 “ 重构” 起点

    在影像软件付费固化的赛道上,像素蛋糕通过免费开放核心功能、推出百场大师课,探索新路径:将工具转为基础设施,竞争从价格转向效率与服务。中国摄影服务市场规模持续增长,预计2028年达8058亿元,企业级SaaS渗透率提升空间大。免费策略重构流程,实现拍摄、修图、交付环节协同,缩短周期,提升效率。未来关键在于模式跨品类复制、知识共享持续产出及增值服务拉�

  • 国庆出国旅游也能秒开远程桌面,揭秘向日葵16的全链路技术升级

    向日葵16远程控制软件在国庆假期展现卓越性能:首帧响应最快0.8秒,毫秒级延迟,弱网环境依然稳定。其核心技术包括全链路GPU硬件编解码与零拷贝路径,大幅减少数据传输延迟;自研SADDC编码器智能优化交互区域画质;配合全球200多个高质量节点及自研低延迟传输协议,实现跨运营商流畅体验。无论是高铁、酒店还是境外,都能像本地一样丝滑操作,让远程办公无忧无虑。

  • 微云全息(NASDAQ: HOLO)推动数字立体安全认证技术,为个人隐私筑牢防线

    随着互联网和移动互联网的快速发展,我们正迈向“万物互通”时代。数字经济的底层技术逐步拓展至应用领域,其价值日益凸显。信息传递方式从传统模式转变为通过连接用户节点实现全网广播,形成共识与信任机制,并能进行价值创造与传递。数字技术已渗透至政府、金融监管、物联网、征信及溯源防伪等领域,与监管科技和金融科技深度融合。然而,哈希算法虽能提供安全数据管理,但在信息隐私和机密性方面仍存不足。微云全息提出数字实体安全认证技术,采用先进加密算法和密钥管理体系,结合智能合约实现自动化隐私保护与数据管理,降低人为操作风险,打造安全匿名系统,助力开启新时代技术革命。

  • 硬核创新比肩华为,Momenta首度荣膺WNEVC 2025全球新能源创新技术

    9月27日,2025世界新能源汽车大会在海口开幕。会上,Momenta凭借其全场景量产辅助驾驶方案Mpilot,荣获“全球新能源汽车创新技术”奖项。该方案基于全国首个量产“端到端大模型”,实现全场景智能驾驶,覆盖复杂道路环境,极大减轻驾驶员负担。目前,Momenta合作车型超160款,覆盖奔驰、宝马、丰田等全球主流车企。未来,公司将持续推动无人驾驶技术规模化落地,助力智能出行产业发展。

  • 全面对标底气!雷军:小米17很多技术领先苹果17 且领先时代

    昨晚发布会后,雷军接受媒体的群访,期间也是谈了不少有趣的话题。 雷军表示,2019年小米全年的研发费用75亿,这个情况下要投1000亿是很大的数字。 但是不管风吹雨打,我们坚定的完成了这笔投资,大概投了1020亿~1050亿。我们新5年的规划是2000亿的研发投入。所以大家今天看到的变化,其实这背后就有海量研发投入的结果。” 雷军进一步表示,很多东西如果你没有足够�

  • 超越RGB的全局高色域有多狠?2025最值得期待的电视技术还得看SQD-Mini LED

    TCL最新发布的SQD-Mini LED技术突破行业十年色域瓶颈,实现100% BT.2020全局高色域,结合超级量子点与超强控光技术,解决了传统RGB-Mini LED色彩纯度不足、串色等问题。搭载该技术的X11L电视以万象分区精准控光提升对比度,色彩还原精准、过渡自然,树立了"光色双绝"新标杆,推动高端电视画质进入新纪元。

  • 全球AI计算规模效应拐点凸显,谷歌/阿里/微美全息开启云智算“战略博弈”之争

    谷歌作为英伟达顶级芯片大买家,通过云服务向OpenAI等客户提供算力,同时加速自研AI芯片布局。阿里巴巴加大AI与云计算投资,与博世深化合作推动企业数字化转型。微美全息构建全场景算力覆盖体系,聚焦新型算力系统突破。AI产业持续发力,从消费转向AI与云计算投资,行业有望受益于新老玩家共同推动的高韧性增长。AI算力应用价值进一步凸显,推动技术迭代与行业水平提升。

今日大家都在搜的词: