首页 > AI头条  > 正文

数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪

2024-09-23 11:08 · 来源: AIbase基地

还记得月初刚发布时就让大家惊艳不已的字节新项目Loopy吗?这个让数字人声音完美匹配画面还匹配表情和情绪的对口型项目已经正式在即梦上线了。

111.jpg

AIbase体验了一下,效果非常不错,可以说是目前支持中文效果最好的对口型服务了。

以往,对口型视频往往存在一个通病,那就是看似嘴型对上了,但总感觉这个声音不是他发出来的,以至于大家看对口型视频的时候,会有一种割裂感。

字节跳动和浙江大学的科研团队联合开发的基于音频驱动的视频扩散模型LOOPY完美解决了这个问题。

image.png

不同于以往的对口型只是张张嘴,Loopy可以让对口型视频中的角色在说话或唱歌时,还自动带上该语境下相应的语气,情绪和表情。它可以精准地"指挥"虚拟形象的每一个细微动作,例如叹息等非语音动作、情绪驱动的眉毛和眼睛运动以及自然的头部运动。

目前,这一功能已经集合进字节旗下即梦的视频生成模块内:

AIbase上传了一张女孩的照片测试一下,

即梦里面的对口型目前可以选择两种对口型方式:

1、文本朗读

文本朗读.jpg

即梦的操作基本都很简单,只需要上传你要对口型的角色图片或视频,然后输入文本,选择一个配音即可。这里AIbase选了一个高冷御姐的配音,测试效果如下:

可以看到,人物在说话的同时,还会有一些细微的表情,而且说话的时候,法令纹那些细节的动态也比较真实

2、上传本地配音

而且,你不但可以让她说话,还可以上传一段唱歌的音频,让她开口唱歌:

对口型,图片+本地配音.jpg

这里AIbase选择了一段抖音最近比较火的野人节选片段,看看效果:

效果真不错,不仅口型对上了,而且声音不会让人有割裂的感觉,仿佛女孩的原声就是这样的。

不过有一个小问题,AIbase选的这个女孩照片,眼睛没看向观众,可能代入感不够强烈,我再换一个正面的试试:

这样是不是好多了,而且人物在唱歌的时候,还会有闭眼,摇头这样很真实的动作。

AIbase还测试了一个男生版的,效果如下:

效果是不是很惊艳?比较让AIbase惊喜的是,它在对口型的时候,还会考虑到喉结,眉毛等这些很细微的变化细节。使得整体的视频更加真实。

感兴趣的可以自行体验哦~

即梦产品入口:https://top.aibase.com/tool/jimeng

  • 相关推荐
  • Alo真能在中国火起来?

    ​“哪里能买到Alo?”这是今年小红书上时常出现的问题。 在相关话题的评论区,用户们的热情远超普通商品讨论:有人分享自己刚在泰国专柜购买的款式和价格,有资深买家推荐“月销上万件的淘宝高仿店铺”,更有专职代购直接打出“韩国帮代,私询价”的广告。 尽管Alo Yoga尚未在中国大陆开设任何官方门店,这个来自洛杉矶的高端瑜伽品牌却以惊人的速度渗透进都市女性

  • 微信朋友圈评论区能发表情包和图片:缓存可清理 不会太占用存储空间

    上个月,微信开始灰度测试朋友圈评论区带图功能,支持用户用表情包和图片进行评论。 有网友表示,微信现在评论可以带图了,我想知道评论区的图片会不会缓存下来占用我的手机空间。 对此,微信员工客村小蒋表示,在讨论微信占空间时,有两种需要区分的数据:可再生数据和非可再生数据。

  • 闪剪AI有多香?定制数字人+方言语音克隆+智能成片,这功能真的太懂小白了

    文章介绍了"闪剪AI"这款智能视频生成工具如何帮助实体商家解决线上获客难题。该工具具有三大核心功能:1)30秒视频即可1:1复制用户形象和声音的数字人功能;2)自动生成符合本地化需求的实体店营销文案;3)智能成片功能,无需剪辑就能制作高质量短视频。此外还支持多方言配音、直播切片等特色功能,大幅降低内容创作门槛。作者作为技术小白亲身验证,该工�

  • 游戏是怎样炼成的?解锁数字创造力 世纪华通公益游学开营在即

    中国3A游戏正以《哪吒:魔童闹海》《Whiteout Survival》《传奇》《龙之谷》等作品展现全新魅力,成为文化传承桥梁和科技创新前沿。世纪华通推出公益游学项目《游戏是怎样炼成的》,通过游戏关卡设计、美术创作等课程,帮助青少年从玩家转变为创作者。该项目采用游戏化教学方式,由资深行业专家和教育学者共同授课,旨在激发青少年创造力。世纪华通总裁谢斐表示,中国游戏产业迎来发展良机,正从单纯娱乐向更深层次的文化科技载体转型。公司持续关注未成年人成长,通过"小童善治"、网络素养夏令营等项目助力青少年健康发展。

  • ZEGO AI Agent:支持一张图生成数字人

    即构科技推出AI Agent2.4,用户只需上传一张正面照即可生成1080P高清数字人,支持实时互动对话。该技术具备400ms超低延迟、2秒内完成自然交互响应,唇形同步准确,支持文本/音频/语音流驱动。适用于教育、客服等场景,提供API灵活定制,实现低成本批量生成。核心技术融合照片驱动与实时AI交互引擎,在生成效率、拟真度方面显著提升,带来低门槛、高沉浸的数字人互动体验。

  • 巨石强森给女儿当美妆模特 表情亮了:毫无明星架子

    ​近日,国际知名影星、前WWE(世界摔角娱乐)冠军巨石强森再次成为公众关注的焦点,不过这次并非因为他在银幕上的英勇表现,而是因为他以一种别出心裁的方式展现了对女儿的深深爱意——为女儿当起了“化妆模特”。 据相关报道,巨石强森在社交媒体上分享了一组自己作为女儿“化妆实验品”的照片,画面中他满脸笑意,任由女儿在自己的脸上涂抹各种色彩,从夸张

  • 抖音上线电影评分功能 多部热映影片均低于及格线

    今日,抖音已上线电影评分功能。 目前,抖音院线电影已公开披露包括《长安的荔枝》《酱园弄》《侏罗纪世界:重生》在内的数部电影评分。 其中,《酱园弄悬案》《侏罗纪世界:重生》抖音评分分别为:6.2分、6.0分,均低于及格线。 据悉,今年6月下旬,抖音在2025抖音电影奇遇夜上宣布,将于暑期档陆续公布电影用户评分。 用户可通过抖音平台内电影相关视频、热点�

  • 闪剪AI:一键生成数字人营销视频,助力商家轻松实现内容获客

    闪剪AI是一款专为营销视频制作设计的智能工具,主要解决实体商家和小白用户制作高质量营销视频的痛点。核心功能包括:1)一键生成数字人视频,支持定制专属形象;2)提供1000+数字人模特素材;3)多语种语音克隆,实现本地化内容;4)内置爆款文案素材库;5)智能成片功能简化制作流程;6)照片数字人让静态图片"开口说话";7)直播切片功能实时引流。该工具

  • A日报:Stability AI发布实时重建模型SPAR3D;火山引擎“奇美拉”数字人平台启动封测;京东重磅开源JoyAgent-JDGenie

    AI日报栏目精选了人工智能领域最新动态:1)Stability AI推出0.7秒单图3D重建模型SPAR3D;2)GitHub热门开源AI协作框架CrewAI获3.4万星;3)马斯克发布儿童AI聊天机器人Baby Grok引发安全争议;4)ComfyUI-C opilot工具简化AI工作流创建;5)CNNIC报告显示我国346款生成式AI完成备案;6)提示词管理工具AI Gist上线;7)开源语言学习工具WordPecker支持多语言学习;8)斯坦福推出多工具协作AI Agent OctoTools;9)Ope

  • 华为Pura80标准版7月30日开售在即 线下预订开启

    华为宣布Pura80标准版将于7月30日上市,虽未公布售价但已引发市场关注。该机型预购用户可享8大权益,包括100元立减、299元Care+服务等优惠。同时Pura80 Pro/Pro+推出直降800元活动,起售价降至5699元。配置方面,Pura80标准版搭载麒麟9010S芯片,配备6.6英寸OLED直屏和2460*1256分辨率,支持120Hz刷新率。后置5000万四摄组合,内置5600mAh电池,支持66W有线+50W无线快充。

今日大家都在搜的词: