南洋理工大学研发DIRFA：仅需音频和照片，就能创造逼真数字人

2023-11-17 09:25 · 稿源：站长之家

要点:
1. 新加坡南洋理工大学的研究团队开发了一款名为DIverse yet Realistic Facial Animations（DIRFA）的计算机程序，可以仅通过音频和一个人的照片创建展示说话者面部表情和头部动作的逼真视频。
2. DIRFA是一种基于人工智能的程序，通过训练模型使用来自The VoxCeleb2Dataset的超过一百万个音频视觉剪辑，以预测语音中的线索并将其与面部表情和头部动作关联，从而生成与口头音频同步的3D视频。
3. 该技术有望在医疗保健等领域推动新应用，提高虚拟助手和聊天机器人的逼真程度，同时对于有言语或面部障碍的个体，可以通过表达性的化身或数字表示来帮助他们传达思想和情感，增强他们的沟通能力。

站长之家(ChinaZ.com) 11月17日消息:在这项最新的研究中，新加坡南洋理工大学的研究团队成功开发了一项名为DIverse yet Realistic Facial Animations（DIRFA）的计算机程序，该程序通过仅使用音频和一个人的照片，就能够生成逼真的视频，展示说话者的面部表情和头部动作。DIRFA是一种基于人工智能的程序，通过训练模型使用超过一百万个音频视觉剪辑，从而能够预测语音中的线索，并将其与面部表情和头部动作关联，从而生成与口头音频同步的3D视频。

数字人虚拟主播 (1)

图源备注：图片由AI生成，图片授权服务商Midjourney

研究人员表示，相较于现有方法，DIRFA在处理姿势变化和情感控制方面取得了显著进展。这一技术创新有望在医疗保健等多个领域推动新应用，提高虚拟助手和聊天机器人的逼真程度，改善用户体验。同时，对于那些有言语或面部障碍的个体，DIRFA还可以作为一个强大的工具，通过表达性的化身或数字表示帮助他们传达思想和情感，提升他们的沟通能力。

研究团队的首席作者表示，语音表现出多种变化，而他们的方法从音频表示学的角度出发，致力于提高人工智能和机器学习的性能。此外，研究者们还指出，DIRFA能够生成具有准确的嘴唇运动、生动的面部表情和自然头部姿势的说话面孔。

然而，研究团队也表示他们正在努力改进DIRFA的界面，以允许用户控制某些输出，比如调整表情。此外，他们计划通过使用更广泛的数据集来进一步优化DIRFA的面部表情，其中包括更多不同的面部表情和语音音频剪辑。

总体而言，这项研究为多媒体交流领域带来了深远而革命性的影响，通过结合人工智能和机器学习等技术，实现了高度逼真的个体说话视频的创作。

（举报）

相关推荐
大家在看

关键词：

数字人

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
怪兽智能数字人解决方案：开启实时对话数字人应用新时代

在当今数字化的时代，智能数字人技术正逐渐成为各行各业的热门话题。怪兽智能数字人解决方案以其出色的性能和广泛的应用场景，为实时对话数字人的应用带来了全新的机遇和挑战。随着技术的不断发展和应用的不断拓展，我们相信数字人将在更多的领域发挥重要作用，为人们的生活和工作带来更大的便利和价值。

智能数字人技术怪兽智能数字人解决方案数字人应用
HairFastGAN官网体验入口 AI换脸换发型图像处理工具使用地址

HairFastGAN是一种用于高分辨率、接近实时性能和出色重建的发型转移方法。该方法包括在StyleGAN的FS潜在空间中运行的新架构、增强的修复方法以及用于更好的对齐、颜色转移和后处理的改进编码器。想了解更多详情并体验HairFastGAN的强大功能，请访问HairFastGAN官网。

HairFastGAN
南洋理工推动画自动填色技术BasicPBC 动画制作效率大大提高

新加坡南洋理工大学的S-lab团队近日宣布，他们开发出了一项创新的动画自动填色技术——BasicPBC。这项技术能够自动为动画中的线条图进行着色，极大地简化了动画制作中繁琐的手动上色步骤。这对于提高动画的质量和观感，有着非常重要的意义。

BasicPBC AI头条
Heygen又一竞争对手？数字人克隆工具Digen AI 可同时保持手势、口型和语调同步

近期，一款名为Digen AI的工具引起了广泛关注，它被认为是Heygen的有力竞争对手。Digen AI的主要功能是克隆数字人，无论是动态还是静态状态下，它都能保持手势、口型和语调的完美同步。这一功能的实现，得益于Digen AI的先进技术。通过深度学习和人工智能技术，Digen AI能够精确地捕捉到人的动作和表情，然后通过算法进行处理，使得克隆的数�

Digen AI头条
京东官宣：刘强东数字人开启直播

快科技4月15日消息，今天下午，京东宣布，京东1号采销”刘强东AI数字人将于4月16日下午6:18开启直播。在预告视频中，刘强东表示，出镜的将是他的分身京东言犀AI数字人，由京东言犀提供技术支持。明天下午6:18，数字人将开启直播首秀”，同时亮相京东家电家居和京东超市采销直播间，为大家带来精彩故事以及低价好物、惊喜福利等。此前，由京东言犀开发的AI数字人已经�
灰豚AI数字人重塑未来，实现AI和逝去的人对话!

ai演生的商业场景，无限广阔!AI复活在今年引爆各大媒体，也形成了完整的产业链。数字人的行业可谓迭代之快，从2023年的一个数字人克隆价位就高达数万元，到数字人直播训练动辄10几元一分钟的价格，再到数字人短视频，数字人导游，数字人政务，数字人客服，3D息影，AI复活等等应用场景。人们的日常生活将和AI息息相关。

AI复活数字人产业普及化
京东云言犀推出文旅服务数字人“花木兰”

京东云言犀数字人花木兰正式入职大同文旅，这标志着大同文旅与京东云合作推出首个文旅服务数字人。数字人花木兰通过京东云言犀技术支持，能够向游客讲解大同的历史和景点，以中英双语进行交流。京东云言犀将继续深耕技术，推动数字人在文旅、直播、金融等领域的广泛应用，助力产业创新和发展。

数字人花木兰京东云言犀大同文旅
周鸿祎北京车展上演爬车顶竟是想证明自己不是数字人

2024年北京车展开幕首日，360集团创始人周鸿祎以一场惊喜亮相成为车展焦点。他穿着鲜艳的红衣，攀上了一辆猛士917的顶部，成为全场瞩目的对象。这次行为让周鸿祎成为北京车展上最特别的焦点人物，引发了众多网友的关注和调侃。

周鸿祎北京车展
职高女孩逆袭成双一流大学研究生：展现不凡毅力和努力

职高女孩赵殷樱的励志故事在社交媒体上引起了广泛关注。这位女孩用九年的时间逆袭成为双一流大学研究生，展现了她不凡的毅力和努力。赵殷樱的故事激励着我们不断前行，无论遇到多大的困难和挑战，我们都应该坚定信念，勇往直前。

职高女孩励志故事双一流大学
职高女孩逆袭成双一流大学研究生：有梦想谁都了不起

近日，职高女孩赵殷樱用9年逆袭成为双一流大学研究生，引发关注。2012年，赵殷樱的中考成绩并不理想，于是她进入了职业高中，从那时起，她就坚定了高考的目标，并且经历了两次高考，最终成功考入了专科。如果能够勇敢地面对困难，积极寻找解决问题的方法，那么就能够逐渐克服障碍，向梦想迈进。

赵殷樱职高女孩双一流大学研究生

TravAI:是一款AI驱动的旅行培训产品，提供交互式AI培训、模拟、评估和智能助手，为旅行行业人员提供最新的技能和知识。

TravAI是一款旅行行业的AI驱动培训产品，通过注入AI技术，为培训注入活力。它能创建引人入胜、交互式的培训课程，进行逼真的角色扮演模拟，并设计能够真正起作用的测验。同时，TravAI利用您的数据为旅行团队量身定制个性化学习体验，让培训不再是通用的、一刀切的。它是培训旅行业专业人员的更智能、更快速的方式。

旅行培训 AI

Nextminds:是一家提供在线辅导服务的平台，为所有科目和学术水平的学生提供个性化辅导。

Nextminds是一个提供在线辅导服务的平台，通过与经验丰富的导师在线互动，为学生提供个性化的学习经验。平台提供ICSE、CBSE和州委员会等多种教育体系的辅导。Nextminds的主要优点是学生可以在舒适的家中与专业的导师进行一对一的在线学习，为学生提供高质量的辅导服务。

在线辅导学习个性化

Pedagogue.io:每天花费10分钟，提升您的AI技能。

Pedagogue是一款AI技能培训平台，旨在帮助个人和企业提升AI技能。通过该平台，用户可以学习AI工具、技术和策略，并获得40%的生产力提升。Pedagogue的优势在于更新及时的内容库、个性化的技能培养、有趣的学习方式以及具有商业价值的数据驱动洞察。

AI 技能培训教育

LexiGym:你的语言学习伴侣。🚀 # #HinkouLabs

LexiGym是一款语言学习应用，帮助用户提升语言技能。它具有离线和多语言支持的创新功能，是最强大的语言学习伴侣。用户可以根据自己的预算选择免费使用或付费订阅，灵活选择学习方式。LexiGym还提供易于创建字典和智能学习等功能，以及详细的训练统计数据。

语言学习词汇训练多语言

Alevels.ai:A Levels AI是一个利用人工智能提高A Levels学习成绩的工具。

A Levels AI利用人工智能技术，提供个性化的学习计划和辅导资源，帮助学生在A Levels考试中取得优异成绩。它通过分析学生的学习情况和弱点，为其提供针对性的学习建议和练习题。A Levels AI还提供实时答疑和学习进度跟踪功能，帮助学生更好地掌握知识。

教育考试辅导人工智能

MailReply:是一款AI助手，可生成专业且人性化的邮件回复，节省时间。

MailReply通过AI生成邮件回复，帮助用户节省时间。它可以在保持人类写作风格的同时，根据邮件内容生成上下文相关的回复。MailReply适用于Windows和macOS，并兼容多种邮件客户端。

邮件回复 AI助手工具

Notification harbor:高性能团队的电子邮件营销平台

Notification harbor是一个为电子邮件营销团队提供AI优化的电子邮件内容和自动化流程的平台。通过使用LLM技术，我们可以在短短5分钟内创建高性能的电子邮件营销内容，并且随着时间的推移，产品甚至可以自我优化。我们的平台简化了电子邮件营销活动的方式，确保每个活动都能精准地与您的目标受众建立联系。AI生成的电子邮件模板根据您提供的信息和要求选择最合适的模板。实时个性化电子邮件可以提高用户参与度和转化率，并根据每个用户实时定制内容。AI驱动的电子邮件营销使您的团队在创建电子邮件模板和文本方面节省了60％的时间。

电子邮件电子邮件营销 AI优化

Magic Loops:通过结合ChatGPT自动化与代码，创建简单的自动化任务

Magic Loops是一种基于ChatGPT的自动化工具，可以连接数据、发送电子邮件、接收短信、爬取网站等功能。它能够帮助用户自动化生活中的各种任务，提高工作效率。Magic Loops的主要优点是可以与各种数据源和应用程序集成，轻松实现个性化的自动化需求。

自动化工具 ChatGPT

ReplyAuto:Reply Auto是一款AI邮件助手，能够根据上下文理解邮件内容，并提供智能回复。

Reply Auto是一款使用AI技术的邮件助手，它能够自动分析邮件内容，根据上下文提供智能回复。它的主要优点是提高工作效率，减轻用户的邮件负担，并能够个性化定制回复。Reply Auto定位于帮助用户更高效地处理电子邮件，提高工作效率。

邮件智能回复工作效率

Mailman Workcation:智能邮递员 - 自动化影响力的智能Twitter机器人

AI Mailman利用最新的人工智能技术创建世界上最准确的邮件，比人类更快速和高质量。它提供简单的用户界面，能够创建世界上最强大的邮件模板，打开率更高。使用AI Mailman创建的邮件打开率是其他方式的10倍，生成时间只需10秒。

邮件自动化影响力

Inpost:一款AI驱动的移动应用程序，可以改善个人电子邮件体验。

Inpost.ai是一款基于AI的移动应用程序，可以优化个人电子邮件体验。它帮助用户智能地组织和清理收件箱，专注于重要的电子邮件。它提供无缝的邮件交互，提供增强的安全性和独家功能。通过高级AI模型分析邮件内容，而不暴露用户的敏感信息。用户可以轻松追踪支出、管理发票，并利用促销优惠来优化个人预算。Inpost.ai还提供定制的收件箱分类，让用户能够个性化和高效地管理和优化收件箱。

电子邮件 AI 个人化

Leadog:AI驱动的冷邮件营销、线索跟踪和互动

Leadog.io是一款AI驱动的冷邮件营销平台，提供冷邮件发送、线索跟踪和互动等功能。它采用先进的AI技术来优化冷邮件营销策略，提供精确的邮件投递和跟踪，帮助用户更好地了解和转化潜在客户。

冷邮件线索跟踪营销工具

Prospect AI:一键查找网站上的电子邮件地址和联系人信息

Prospect AI是一款插件，可以帮助销售团队、数字营销人员和公关专业人员免费查找公司的联系人。它使用人工智能技术，快速获取所需的联系人信息，帮助用户拓展业务关系。

市场营销销售潜在客户

Email whisperer:写作完美邮件，让你的电子邮件沟通更上一层楼！

Email Whisperer是一个用于Gmail和Outlook的AI电子邮件编写工具。它可以帮助你轻松地写出完美的电子邮件，提供重新表达、拼写检查和修正功能。它能够提高你电子邮件的清晰度和风格，并确保邮件无错误。Email Whisperer是一个提高电子邮件写作效率的工具，让你的邮件专业而准确。

生产力电子邮件 AI工具

Humanize AI by AI Text Converter:将AI生成的文本转换为与人类写作相匹配的内容。

Humanize AI Text是一个免费在线的AI文本人性化转换工具，能够绕过AI检测，并将AI生成的文本转换为与人类写作相匹配的内容。

AI转换工具文本人性化 AI检测绕过

Happily.ai:使用，超越传统调查。我们的AI平台分析员工情绪，提供可操作的见解，为健康、投入、高绩效的团队提供支持。

Happily.ai是一个AI工具包，帮助人力资源和经理人通过无忧无虑的参与、认可和绩效管理来提高人才留存和团队生产力。

员工参与度人力资源绩效管理

ChatKPI:是一款基于AI的数据分析工具，可以通过文本消息跟踪销售趋势、识别热门产品、了解客户行为，提供图表、定制CSV等功能。

ChatKPI是一个AI数据分析工具，旨在帮助Shopify商家做出更明智的数据驱动决策。它可以提供实时洞察力，跟踪销售趋势，识别热门产品，了解客户行为，并通过自然语言对话提供个性化的商业洞察。ChatKPI可以通过文本消息或在Shopify商店内安装的应用程序使用。

数据分析销售趋势热门产品

Limodify.AI | Email Marketing Design Meets AI:Limodify.AI通过AI技术提供电子商务邮件创建服务。

Limodify.AI革新了电子商务邮件的创建过程，只需点击几下，选择格式，输入关键信息，即可在30秒内获得准备好发送的AI设计的邮件。节省时间，利用先进技术，精确实现您的营销目标。立即免费开始使用。

电子商务邮件营销 AI

PurplePro:使用AI技术，只需两个点击即可启动您的忠诚度俱乐部。

PurplePro是一个使用AI技术的插件，它可以帮助您在短短两个点击的时间内启动您的忠诚度俱乐部。PurplePro通过游戏化和动态的积分规则增加用户参与度，并奖励他们。它还提供了强大的推荐、挑战、问卷和可变奖励功能，帮助您将首次用户转化为忠实的客户。

忠诚度俱乐部用户参与度奖励

LISUTO:株式会社は、eコマースのセラーやマーケットプレイスが売上を増やし、時間を節約し、コアビジネスに集中できるスマートデータ構造化ソリューションのリーダーです。

LISUTO株式会社は、eコマースのセラーやマーケットプレイスが売上を増やし、時間を節約し、コアビジネスに集中できるスマートデータ構造化ソリューションのリーダーです。LISUTO AIは、AIタッガーやイメージタッガーなどのサービスを提供し、商品のタグ登録やナビゲーション改善などを自動化し、効率を向上させます。

南洋理工大学研发DIRFA：仅需音频和照片，就能创造逼真数字人

今日大家都在搜的词：

热文

站长商机