首页 > 业界 > 关键词  > 纸钞屋最新资讯  > 正文

人工智能公司开发全新语音合成技术 或能帮助解决外语片配音问题

2022-01-20 16:00 · 稿源: cnbeta

据AXIOS报道,一些AI公司正在开发解释和合成广告、电影和电视中的声音的方法。语音合成方面的进展可以帮助解决糟糕的外语片配音问题--它们的出现是因为作为娱乐全球化的一部分,国际内容对电影公司和流媒体平台变得越来越重要。

K{BT{ZGV{$T]`{93E}X9X]T.png

但它们引起了人们对深层伪造音频的可能性以及名人的声音在他们死后可能被使用的担忧。

像《鱿鱼游戏》和《纸钞屋》这样的外语片正在吸引创纪录的观众,但对于试图开拓日益增长的国际市场的电影公司来说,字幕仍然是一块绊脚石。

例如,观看《鱿鱼游戏》配音版的Netflix用户比观看字幕版的用户多。由于大片占用了大量带宽,小型外语内容生产商很难找到足够的翻译和配音演员来满足需求。

人工智能公司Veritone的联合创始人兼总裁Ryan Steelberg说:“我们仍然停留在一对多的广播模式的思维模式中。”Veritone开发了一个名为MARVEL.ai的产品,允许内容制作者生成和授权其所谓的“超现实”合成声音。

这意味着,例如,播客创作者可以将音频广告文案解释为另一种语言,然后MARVEL.ai将生成一个合成版本的声音,用新的语言阅读广告。

Steelberg说:“它让你有能力以更大的规模和更低的成本对音频进行超个性化处理。”

文字转语音技术已经存在了几十年,但Veritone的产品使用了“语音转语音”,Steelberg称之为“语音即服务”。

Veritone可以访问来自媒体库的PB级数据,并利用这些数据来训练其人工智能产品,创建一个原始语音的合成版本,可以针对不同类型的情感或情绪进行调整,或者通过翻译,说出一种外语。

“它不再是另一个人的新声音,例如代表汤姆·克鲁斯说话,”Steelberg说。“这真的将是用汤姆·克鲁斯的声音来说另一种语言。”

NVIDIA一直在开发技术,允许人工智能改变视频或动画的方式,将演员的嘴唇和面部表情与新的语言相匹配--因此将不再有20世纪70年代的电影中那种不同步的配音。这项技术可能会首先用于广告,但随着它向更高质量的内容迁移,它将为明星人才带来潜在的机会和陷阱。

Steelberg说:“在配音和后期制作方面,合成声音将成为主流,你会看到这一点被纳入人才合同。”

这不仅仅是为了确保好莱坞明星(和他们的经纪人)在使用他们的合成声音时获得分成,而且也是为了防止这些声音在技术越来越普及的情况下被劫持用于恶性目的。

值得关注的是,已故名人的声音和其他创造性属性将如何被人工智能所利用?

弗兰克·扎帕等已故音乐家的全息影像已经被用于“现场”表演,带来了数千万的收入,而Kenny G最近发布了与30年前去世的爵士乐大师Stan Getz的“二重奏”。Getz现有资料库中的样本音频资料被用来生成一个新的、合成的旋律--尽管这个旋律被爵士乐作家Ted Gioia称为“Frankenstein唱片”。

举报

  • 相关推荐
  • 大家在看
  • 聚焦人工智能,华坤道威创始人孟宪坤新作《AI风暴:人工智能的商业运用》网同步首发

    由华坤道威创始人孟宪坤先生撰写的新作《AI风暴:人工智能的商业运用》,于 4 月 28 日正式开启全网发售...此次,华坤道威创始人孟宪坤先生新作《AI风暴:人工智能的商业运用》由中国商业出版社出版...孟宪坤先生通过《AI风暴:人工智能的商业运用》,以大量的人工智能应用进行实例解剖,真情实景地阐述“人工智能如何赋能商业”,企业数字化转型制胜的发展方向...孟宪坤先生在《AI风暴:人工智能的商业运用》中阐明,算法的设计关键取决于数据结构,而大量数据沉淀和数据处理能力是支撑一切算法设计的基础......

  • 大疆发布 AI 人工智能教育套件,流程 AI 学习重定义中小学人工智能教育

    DJI 大疆创新于 2022 年 4 月 21 日正式发布 AI 人工智能教育套件,将中小学人工智能教育引领至全新高度...大疆教育的目标是借助 AI 人工智能教育套件,打造一个兼具低门槛和高上限的 AI 学习平台,并期待通过它让更多学校、机构、组织关注并加入青少年的人工智能教育...本次发布的 AI 人工智能教育套件为大疆的教育版图增添了至关重要的一个版块,为中小学人工智能教育带来了革新性体验......

  • Meta开启长期AI研究项目 欲让人工智能像大脑一样处理语音和文本

    为了解更多关于“人脑是如何处理语音和文本信息”的过程,以改进人工智能语言模型处理相同输入的方式,该公司还与 NeuroSpin 和 Inria 达成了合作...其中一项研究涉及让 AI 语言模型像大脑一样活动以理解下一个单词,另一项则涉及让大脑可提前预测单词或想法...通过特定的编程设计,研究人员可让 AI 语言模型尝试通过类似人脑的活动来推测下一个单词,从而显著改进此类工作的效率......

  • 标贝科技推出日语语音合成服务 持续赋能企业出海

    面对发展潜力巨大的日语市场,标贝科技通过采集大量的日语语料、对合成模型进行优化训练,推出高质量、纯正的日语语音合成服务,并在官网、标贝开放平台、标贝AI语音工坊小程序同步上线日语女声“贝小樱”、男声“贝小野”两个音色,满足多场景下日语语音合成的需求,欢迎各应用厂商及企业开发者体验...语音合成服务方面,除了本次新上的日语能力,标贝科技还可以支持韩语、巴葡、英语等多个语种,并在每种语种下安排一到多个发音人,满足用户多样化选择的要求......

  • 研究人员通过人工智能利用推特预测粮食短缺问题

    宾夕法尼亚州立大学和卡塔尔哈马德-本-哈利法大学的研究人员表示,推特上的推文所表达的情绪和情感可以被实时用来评估大流行病、战争或自然灾害供应链中断可能导致的粮食短缺。他们发现,在COVID-19大流行的早期,在美国某些州,表达愤怒、厌恶或恐惧的与食品安全有关的推文与实际的食品不足密切相关。研究人员说,这些发现有可能被用来开发一个低成本的早期预警系统,以确定哪里最需要食品安全干预措施。研究人员表示,COVID-19大流行病的发生及其相关的供应链中断引发了全世界对食物获取和供应的担忧,许多人在社交媒体上表达了这些担忧

  • 人工智能驱动的智能元表面可能会彻底改变我们的生活

    对电磁波和信息的操控和运用已经成为我们日常生活的一个重要部分,而智能元表面已经作为一种智能平台出现,用于自动控制波-信息-物质的相互作用而无需人工干预。它们由工程复合材料演变而来,包括超材料和超表面。我们已经看到了科学技术行业在开发各种形式和性质的超材料和超表面方面的重大进展。在2022年5月6日发表在《eLight》杂志上的一篇论文中,东南大学的崔铁军教授和北京大学的李廉林教授带领一个研究小组回顾了智能超表面的技术进展,论文题目为《智能元表面:控制、通信和计算》,主要描述了对智能元表面的发展的研究,并着眼于

  • 「AI+染色体」人工智能助力健康生育,备孕必看

    如今,三胎政策已全面开放,从“只生一个好”,到“全面二孩”,再到如今来临的“三孩政策”。“催生”是很多经济较发达国家面临的共同挑战,更是世界各国普遍面临的重大问题之一。我国也不例外。谁也料想不到,作为全球人口最多的国家,我们也终究未能逃脱“生育水平下降可能导致的人口负增长”的魔咒。"培养一个孩子已经很累了。"这是多数人的反馈,同时,也是德适生物所全面攻克的方向。如何让宝宝健康出生?伴随着三胎政策的全面开放,我国的生育问题也逐渐被更多人所关注、重视。其中反复流产、不孕不育、新生儿出生缺陷高发等健康现?

  • 提供人工智能合同管理服务,Evisort最新获1亿美元融资

    Evisort是一家使用人工智能技术分析和管理企业合同的初创公司,该公司近日已获得由TCV牵头的1亿美元融资...最新一轮融资包括Breyer Capital、General Atlantic和微软的风险投资基金M12等,使Evisort的总融资达到1.55亿美元...Evisort的人工智能技术可理解合同中的法律含义以及上下文,以自动管理端到端合同流程...结合工作流和文档管理解决方案,Evisort表示,它现在已为包括微软和Keller Williams在内的150多个企业客户提供服务......

  • 百度:截至4月全球人工智能专利申请超过2.2万件

    4月26日是第 22 个世界知识产权日,百度发布《百度人工智能专利白皮书2022》称, 2021 年,百度深度学习专利申请量,自动驾驶专利族数量均排名全球第一...数据显示,截至 2022 年 4 月,百度全球人工智能专利申请超过2. 2 万件,中国专利申请量超过1. 6 万件,中国授权专利超过 4600 件...2021 年,百度荣获人工智能交互领域的唯一中国专利金奖,成为人工智能领域获得中国专利奖奖项最多、获奖级别最高的高科技企业...

  • 通用人工智能最新突破:一个模型、一套权重通吃600+视觉文本和决策任务

    DeepMind让它在604个不同的任务上接受了训练,这些任务模式完全不同,需要观察的元素和行为规则也不同...在Bengio团队推出的BabyAI测试上,Gato几乎在所有关卡达到了专家水平的80%,最难的几个Boss关达到75%...在Meta-World上(虚拟环境中操作机械臂),Gato在全部45个任务中,有44个超过专家水平的50%,35个超过80%,3个超过90%......

今日大家都在搜的词: