首页 > AI头条  > 正文

秘密研发3年,这家公司用AI颠覆了视频配音,连TED都买单了

2024-11-12 09:59 · 来源: AIbase基地

一家名为 Panjaya 的创业公司正在彻底改变视频翻译的游戏规则。经过三年秘密研发,该公司推出了突破性产品 BodyTalk,这是一款能够将视频中人物声音精准转换为其他语言的 AI 工具。不同于传统配音,BodyTalk 不仅能完美复制说话者的原声特征,还能自动调整视频中人物的面部表情和肢体动作,使其与新语言的语音模式自然匹配。

Panjaya 由两位以色列政府深度学习专家希利克·沙尼(Hilik Shani)和阿里尔·沙洛姆(Ariel Shalom)创立。2021年,两人离开政府部门创业,随后迎来了具有丰富行业经验的盖伊·皮克兹(Guy Piekarz)担任 CEO。皮克兹此前创立的流媒体发现与推荐平台 Matcha 曾在2013年被苹果公司收购。

音频 声波

图源备注:图片由AI生成,图片授权服务商Midjourney

目前,BodyTalk 已支持29种语言的翻译。其工作流程首先是进行音频翻译,然后生成模仿原声说话者的新语音,最后自动调整视频中说话者的口型和动作以匹配新的语言表达。虽然处理时间已接近实时,但目前仍需要几分钟才能完成一段视频的处理。

在技术层面,Panjaya 采用了混合策略,既利用第三方大语言模型,也自主研发核心技术。据皮克兹介绍,公司的唇形同步引擎完全由内部 AI 研究团队开发,因为市面上没有能满足其多角度、多说话者等复杂商业场景需求的解决方案。

公司目前专注于 B2B 市场,已与 JFrog 和 TED 等机构达成合作。TED 表示,使用 Panjaya 工具配音的讲座视频观看量增加了115%,完整观看率翻倍。公司计划进一步拓展体育、教育、营销和医疗等领域的应用。

为了避免技术滥用,Panjaya 严格控制工具的使用权限,并计划开发水印等功能来识别经过合成的视频内容。尽管字幕已成为视频内容的标配——据 CBS 调查显示,超过一半的美国观众会在观看时开启字幕——但国际市场对配音内容的需求依然巨大。研究机构 CSA 的数据表明,特别是在 B2B 领域,母语内容能带来更高的用户参与度。

此轮950万美元融资由多家投资机构和个人参与,包括 Viola Ventures、R-Squared Ventures 以及 JFrog 联合创始人兼 CEO 什洛米·本·海姆(Shlomi Ben Haim)等。未来,Panjaya 计划推出 API 接口,并进一步提升处理速度,向实时处理的目标迈进。

  • 相关推荐
  • 这家中国软件巨头,靠AI能否“蝶变”?

    在企业级AI这场军备竞赛中,或许比企业更着急的是用友、金蝶这些中国传统软件巨头。 今年3月,金蝶发布2024年财报时,金蝶集团董事会主席兼CEO徐少春表示:“金蝶的云转型已经成功,下一个目标就是AI转型。” 2个月后,金蝶围绕企业管理AI已形成体系化技术产品。 金蝶升级企业级AI平台苍穹Agent平台2.0,并基于此底座搭建N个场景化智能体,同时还提供了100+个AI应用场景�

  • 18亿,阿里又投了一家公司

    不久前,美图发布公告,官宣获得阿里巴巴2.5亿美元(约合人民币18亿元)的战略投资。 相较于财务方面,更值得关注的是两家公司即将深入的业务合作。公告透露,二者将在电商、AI技术、云端算力等领域展开战略合作。

  • 声音革命!逗哥配音以独家达人声库重塑短视频创作新生态

    国内领先的智能配音平台"逗哥配音"推出全新升级的"臻品达人声库",通过动态扩容的独家声音资源和精准的风格适配能力,帮助短视频创作者提升内容吸引力。数据显示,使用该功能的短视频播放量达行业基准值的1.8倍。平台采用"数据优选+专业打磨"模式,精选超10亿播放量验证的顶级解说者资源,每季度新增20+达人声线,覆盖影视解说、游戏、好物推荐等20余个垂直领域。独创的"声效数据库"提供3000余种场景化音效模板,实现一键匹配专业级声场。某品牌营销案例中,创作者使用专属声线将产品视频转化率提升至15.7%。目前平台已覆盖微信小程序、PC端及移动APP全平台,支持80种语言实时转换。

  • 成都汇阳投资关于固态电池+低空经济 10 家公司

    国内首条全固态电池实验线建成,宁德时代、亿纬锂能等头部企业加速技术研发,推动产业化进程。eVTOL飞行器对动力电池要求严苛,需能量密度突破400-600Wh/kg并支持快充,固态电池正契合其需求。低空经济作为新兴战略领域,蕴含万亿级市场空间。多家企业布局固态电池与低空经济:国轩高科研发350Wh/kg全固态电池;安泰科技开发稀土永磁材料支撑固态电池;华丰科技与中科院合作研发400Wh/kg锂金属固态电池;蓝海华腾投资固态电芯研发;南都电源开发350Wh/kg适配飞行器的固态电池;德尔股份开发提升能量密度的涂布工艺;万丰奥威收购德国Volocopter布局eVTOL;川润股份开发液冷散热技术;中科电气研发硅碳负极材料;上海洗霸突破固态电解质技术。建议关注业绩超预期标的及长期布局低空经济、储能等领域的企业。投资需谨慎,风险自担。

  • 令外国记者惊叹的智能场景:国内AI如何颠覆会议办公?

    中国科技产品MAXHUB AI会议平板引发海外热议。迪拜记者方浩明体验后惊叹其AI会议功能,包括发言人识别、自动翻译和多语言模拟跨国研讨,30秒生成结构化会议纪要。该产品已进入全球80个国家和地区,服务95万间会议室。网友称赞中国数字化办公进步神速,期待更多创新产品走向世界。这展现了中国从"制造"到"智造"的转型实力,人工智能等新技术正助力"中国智造"展现全球魅力。

  • 逗哥配音:以“独家臻品达人”重塑短视频创作体验,播放量突破100亿+次

    逗哥配音平台凭借独特的"臻品达人"真人声音库,在短视频配音领域掀起创作革命。平台精选各领域专业解说达人的真实声音,经过严格筛选打磨,形成覆盖近千种风格与方言的声音宝库。这些自带故事感与专业背书的声音,已助力创作者产出累计播放量突破10亿的爆款内容。与机械合成音不同,逗哥的真人声音能精准驾驭影视解说、好物推荐等多元场景,显著提升完播率和互动率。行业观察指出,在AI配音同质化竞争中,逗哥通过对真人声音价值的深度挖掘,构建了难以复制的竞争壁垒,重新定义了短视频的听觉体验。

  • Meta AI新增生成式AI视频编辑功能:秒换服装、场景

    Meta 宣布,将在Meta AI应用、Meta.AI网站和Edits应用上推出一项生成式AI视频编辑功能。 用户可通过50多种预设AI提示词,一键实现视频中服装、场景、光影等元素的智能变换。 Meta称,全新的AI视频编辑功能直观易用,用户无需任何视频编辑专业知识即可制作高质量的视频。首先,用户可将视频上传到Meta AI应用、Meta.AI网站或

  • 企业比特币热潮:18 家公司 5 天内增值 12.2 亿美元

    未来几个月将是比特币“身份跃迁”的关键窗口期,从“投机币”跃升为“核心资产”,或许只是时间问题……

  • 英语听力配音员露脸了:你一定听过他的声音

    据媒体报道,有博主在短视频平台上发布了一段英语听力测试视频,并配文你可能不认识我,但你一定听过我的声音”。 这段视频引发广泛关注,不少网友留言表示,终于见到素未谋面的仇人”了。 还有网友说,陪伴那么多届考生英语听力的人竟然是他,希望老师举办一场线下见面会。 在每年的高考英语考试中,听力测试是不可或缺的一环,听力考察的是学生听力能力和�

  • Switch2加速器怎么选?奇游618日均4毛解锁3年极速联机

    奇游联机宝618推出Switch2加速方案:三年卡首单468元日均0.43元,两年卡388元史低价。三大亮点:1)长时效覆盖Switch2全生命周期,支持PC/手游多端加速;2)分享专属码组队可获30天时长;3)购卡抽免单,半价福利覆盖全档位。6.13-6.19活动期间,Switch玩家可囤加速套餐,日均不到0.5元享受极速联机体验,新机发售即享满血游戏体验。

今日大家都在搜的词: