首页 > 业界 > 关键词  > Google最新资讯  > 正文

Google新工具Aloud将使视频配音免费化

2022-03-10 07:38 · 稿源: cnbeta

Google的孵化器Area 120一直在开发一个名为Aloud的新工具。有了Aloud,内容创作者将能为他们的视频进行多语言配音并使他们能接触到更多的观众。虽然这些创作者已经可以在YouTube上使用字幕,但Aloud将能把创作者跟那些不喜欢字幕或也许不识字而无法阅读字幕的人联系起来。

从今天起,创作者可以申请提前使用Aloud,但它现在只支持少数几种语言--西班牙语、葡萄牙语、印地语、印尼语。Google表示,它将很快扩大提供的语言,并希望当它离开早期访问时情况会是这样。

Google在谈及目前状况的问题时说道:“字幕可以帮助缩小语言差距,但在移动设备上并不总是理想的,因为外形尺寸小、必须持续关注屏幕且对于那些有视觉或阅读障碍的人来说也存在无障碍挑战。配音,即添加翻译过的语音轨道的过程,则克服了这些限制,但对大多数创作者来说是耗时和成本高昂的。”

为了避免为内容配音所要做出的努力和成本,Aloud使用了音频分离、机器翻译和语音合成来为创作者完成配音的重任。创作者需要做的就是提供视频和原文字幕--如果没有字幕,那么可以审查自动生成的文字记录以确保一切正确。

而为了帮助提高透明度,使用Aloud制作配音的创作者必须在视频描述中明确说明,作为钉子的评论,或在片尾字幕屏幕中说明他们使用的是合成配音,并提及原始内容。最初,Google希望将Aloud配音引入教育内容,然后再将其推广到其他内容类型。

举报

  • 相关推荐
  • Aloudata Agent公测开启:NoETL+大模型=好数据驱动真智能,让“万数皆可问”

    4月22日,Aloudata大应科技推出自研的Aloudata Agent,这是一款基于NoETL明细语义层的分析决策智能体,旨在通过自然语言实现数据查询、归因诊断、报告生成等功能。该产品解决了企业数据分析面临的五大挑战:语义鸿沟、口径一致性、场景覆盖度、性能优化和数据权限管控。Aloudata Agent采用NL2MQL2SQL技术路径,通过指标语义层实现业务语言与数据语言的精准对齐,显著提升查询准�

  • 谷歌CEO皮查伊:反垄断提案可能毁灭Google搜索!

    快科技5月1日消息,谷歌CEO桑达尔皮查伊(Sundar Pichai)在美国司法部(DOJ)针对谷歌反垄断案的证词中,强烈反对政府提出的修正措施。皮查伊表示,这些措施将对谷歌搜索造成毁灭性影响”,并可能阻碍公司在搜索引擎领域的持续创新。在法庭上,皮查伊指出,美国司法部要求谷歌与竞争对手分享搜索数据的提议,将使谷歌难以继续开发其搜索引擎,甚至可能导致公司无法再进行创新投资。他强调,谷歌在搜索和人工智能(AI)等领域的研发投入巨大,仅去年就达到了490亿美元。他还警告称,数据共享提议将使竞争对手能够完全逆向工程我们的技术”

  • 怎么在 Chrome 浏览器中使用 Google Lens?

    Google Lens 是一款基于图像识别和OCR技术的人工智能应用,能够让机器学会“看图说话”,它能实时识别用智能手机相机所拍摄的物品、并提供与之相关的内容……

  • OpenAI,Google和阿里们都“认”了的MCP,究竟给开发者带来啥实惠了

    AI领域的互操作性标准之争正变得异常热闹。GoogleDeepMindCEODemisHassabis宣布,将为其Gemini模型添加对Anthropic主导的模型上下文协议MCP的支持,称其为“一个优秀的协议,正迅速成为AIAgent时代的开放标准”。MCP有潜力成为提升AI在具体业务场景中实用性的关键基础设施,促进AI与现有软件和工作流程更紧密的融合。

  • 谷歌搜索弃用国别顶级域名后缀!全球统一为google.com

    快科技4月16日消息,谷歌宣布将在未来几个月内逐步将所有搜索用户重定向至主域名google.com,将不再使用国家代码顶级域名(ccTLD)。无论用户使用哪个国家的域名访问谷歌搜索,如英国的google.co.uk或巴西的google.com.br,最终都将被重定向至google.com。谷歌表示,这一决定旨在简化用户体验,并确保所有用户都能获得一致的搜索结果。此前谷歌之所以采用国别顶级域名的后缀,主要是可以实现搜索结果的本地化,例如当用户访问的是google.com.uk,则侧重于提供来自与英国有关的搜索结果。自2017年以来,谷歌已经根据用户的地理位置自动调整

  • 谷云科技周年庆钜献!ETLCloud社区版会员权益限时重磅升级,加速数据集成效率!

    谷云科技ETLCloud社区版8周年庆推出会员权益升级计划:即日起至2025年6月18日,购买VIP/SVIP会员可享多重福利,包括免费组件(200积分内任选1个)、组件8折+流程9折优惠。VIP会员299元/年解锁45条流程数、2次技术支持等权益;SVIP会员3999元/年享60条流程数、无限次资料下载等增值服务。活动期间开通会员还可享一年内组件8折+流程9折特惠。周年庆限时福利不容错过,助力用户高效玩转数据集成。

  • 智能语音革新创作生态:逗哥配音AI赋能短视频产业升级

    在全民视频创作浪潮中,有码科技旗下"逗哥配音"AI配音软件平台以技术创新重塑内容生产范式。该平台通过深度神经网络算法构建的语音合成系统,现已支持中英日韩等30 多种语言,包含超千款音色库,其独创的"情感韵律建模"技术可使AI配音与真人相似度达98.2%,实现 10 秒内完成文案智能转译与语音生成。依托深耕AI配音领域的技术积淀,企业组建由 30 余名算法工程师构成的

  • 国际知名半导体研究机构SemiAnalysis称:华为云CloudMatrix 384领先英伟达和AMD的产品一代

    近日,国际知名半导体研究和咨询机构SemiAnalysis发布专题报道称,华为云最新推出的AI算力集群解决方案CloudMatrix 384(以下简称CM384)凭借其颠覆性的系统架构设计与全栈技术创新,在多项关键指标上实现对英伟达旗舰产品GB200 NVL72的超越,标志着中国在人工智能基础设施领域实现里程碑式突破。(图片引自SemiAnalysis报道)据SemiAnalysis披露,华为云CM384基于384颗昇腾芯片构建,通

  • 逗哥配音充值风暴来袭,会员限时折扣+高额共创分成计划,颠覆AI配音行业

    国内AI配音头部品牌"逗哥配音"宣布将于4月28日启动"宠粉狂欢节"活动,推出会员折扣叠加佣金裂变双重优惠。平台拥有近千款真人级音色库,支持方言适配和智能情绪调节,日均生成配音超千万条。活动期间购买半年及以上会员可享八折优惠,年度会员额外获赠1个月使用权,折算后日均成本低至0.5元。平台同步升级推广机制,打破行业20%固定分成上限,推广效果达标者可获最高60%收益。数据显示,当前AI配音工具渗透率不足30%,逗哥凭借技术降本和生态赋能,或加速行业从"功能竞争"转向"生态赋能"新阶段。

  • 腾讯混元视频生成工具全新开源:人物不会“变脸” 物体不会“漂移”

    腾讯混元5月9日宣布推出开源的多模态定制化视频生成工具HunyuanCustom。该工具基于混元视频生成大模型打造,支持文本、图像、音频等多模态输入,能生成高质量定制视频。主要功能包括:单/多主体视频生成、视频配音、局部编辑等,在保持主体一致性的同时可灵活调整场景和动作。适用于广告、电商、影视等场景,如快速更换商品背景、制作数字人视频等。目前单主体生成功能已开源,其他功能将于5月陆续开放。用户只需上传图片和文字描述即可生成连贯自然的视频内容。