首页 > 业界 > 关键词  > 数字人最新资讯  > 正文

南洋理工大学研发DIRFA:仅需音频和照片,就能创造逼真数字人

2023-11-17 09:25 · 稿源:站长之家

要点:

1. 新加坡南洋理工大学的研究团队开发了一款名为DIverse yet Realistic Facial Animations(DIRFA)的计算机程序,可以仅通过音频和一个人的照片创建展示说话者面部表情和头部动作的逼真视频。

2. DIRFA是一种基于人工智能的程序,通过训练模型使用来自The VoxCeleb2Dataset的超过一百万个音频视觉剪辑,以预测语音中的线索并将其与面部表情和头部动作关联,从而生成与口头音频同步的3D视频。

3. 该技术有望在医疗保健等领域推动新应用,提高虚拟助手和聊天机器人的逼真程度,同时对于有言语或面部障碍的个体,可以通过表达性的化身或数字表示来帮助他们传达思想和情感,增强他们的沟通能力。

站长之家(ChinaZ.com) 11月17日 消息:在这项最新的研究中,新加坡南洋理工大学的研究团队成功开发了一项名为DIverse yet Realistic Facial Animations(DIRFA)的计算机程序,该程序通过仅使用音频和一个人的照片,就能够生成逼真的视频,展示说话者的面部表情和头部动作。DIRFA是一种基于人工智能的程序,通过训练模型使用超过一百万个音频视觉剪辑,从而能够预测语音中的线索,并将其与面部表情和头部动作关联,从而生成与口头音频同步的3D视频。

数字人 虚拟主播 (1)

图源备注:图片由AI生成,图片授权服务商Midjourney

研究人员表示,相较于现有方法,DIRFA在处理姿势变化和情感控制方面取得了显著进展。这一技术创新有望在医疗保健等多个领域推动新应用,提高虚拟助手和聊天机器人的逼真程度,改善用户体验。同时,对于那些有言语或面部障碍的个体,DIRFA还可以作为一个强大的工具,通过表达性的化身或数字表示帮助他们传达思想和情感,提升他们的沟通能力。

研究团队的首席作者表示,语音表现出多种变化,而他们的方法从音频表示学的角度出发,致力于提高人工智能和机器学习的性能。此外,研究者们还指出,DIRFA能够生成具有准确的嘴唇运动、生动的面部表情和自然头部姿势的说话面孔。

然而,研究团队也表示他们正在努力改进DIRFA的界面,以允许用户控制某些输出,比如调整表情。此外,他们计划通过使用更广泛的数据集来进一步优化DIRFA的面部表情,其中包括更多不同的面部表情和语音音频剪辑。

总体而言,这项研究为多媒体交流领域带来了深远而革命性的影响,通过结合人工智能和机器学习等技术,实现了高度逼真的个体说话视频的创作。

举报

  • 相关推荐
  • 快手磁力开创推出「wow捏人大师」,专属数字人形象为广告素材提效

    磁力开创推出“wow”智能体重秤,帮助商家破解传统视频拍摄成本高、效率低的痛点。通过输入文字或上传照片,即可定制专属数字人形象,并调整年龄、姿势等细节。结合营销脚本,平台能一键生成口播精准、表情自然的短视频初稿,还支持高级编辑功能。该工具大幅降低内容创作门槛,让商家以“分钟级”速度稳定产出优质视频,实现经营效率跃升。

  • 老翟2025数字物流大会演讲实录

    在数字物流大会上,G7易流分享了行业三大变化:一是2025年货运量首次显著增长超5%,短途运输比例上升形成"剪刀差";二是新能源车成为主流,自动驾驶进入商业化阶段;三是数字化需求深化,即时零售、农牧等行业成为新增长点。面对物流下半场,G7提出"自底向上、软硬一体、知行合一"的AI战略,并发布首款AI产品"紫宝盒",通过边缘计算实现感知、沟通、执行的闭环,帮助行业突破人力瓶颈,将经验转化为可复制的AI能力。

  • AI 无人测试:破解金融机构数字化转型的质量与效率困局

    金融机构数字化转型面临双重挑战:既要快速迭代高频业务满足用户即时性需求,又需在严监管下保障系统安全合规。传统测试因效率低、成本高难以应对复杂场景,而AI驱动的“无人测试”通过三阶段演进(辅助生成→协同执行→自主决策)实现质效双升。实践显示,AI测试可将周期缩短70%、成本降30%,并自动生成合规报告。未来75%金融机构将采用AI增强测试方案,国内厂商如Testin云测更适配本土合规需求。无人测试已成为兼顾业务增长与风控的战略选择,推动行业进入高质量、高效率、高合规新阶段。

  • 海尔智家数字变革再加速,前三季度74%商品直达用户

    海尔智家2025年三季报显示,前三季度营收2340.5亿元,同比增长10%;归母净利润173.7亿元,增长14.7%,创历史新高。业绩增长得益于智慧家庭、数字化和全球化战略推进,其中数字化库存变革实现全面统仓TOC,县专卖店74%商品直达用户,降低资金压力、提升周转效率,推动轻资产运营。POP渠道新增61家客户,零售增量3.68亿元。用户可全程可视化体验,送装同步提升满意度。企业通过数字化研发、制造等全流程变革,强化核心竞争力。

  • 小米最火数字旗舰:小米17系列激活量即将突破200万

    小米14系列销量火爆,截至10月26日累计激活量突破185万台,即将突破200万。该系列9月25日发布,首发起售价4499元,开售5天销量破百万,创小米数字旗舰销售纪录。创新亮点在于背部副屏设计,支持时钟显示、AI头像生成、出行提醒等功能,还能实现后置摄像头自拍预览和他人协助拍摄时的实时构图查看。配合复古造型保护壳,用户可用副屏玩怀旧游戏。小米总裁卢伟冰透露,下一代手机将继续沿用副屏设计并加大研发投入。

  • 密码筑基,合规护航——香港·内地数字资产交流会成功举办

    10月17日,香港中资银行业协会、德勤与信安世纪联合主办的"数字资产交流会"在港举行。会议聚焦密码技术在构建数字资产安全底座、保障业务合规中的核心价值,探讨了稳定 币等数字资产在发行、托管及跨境支付全周期的安全与合规问题。信安世纪专家指出,密码技术是数字资产信任体系的基石,并分析了商用密码在数字人民币、跨境支付等金融场景的应用实践,为

  • 数字化转型助力!2025年三季报:海尔冰箱份额、增量均第一

    10月30日,海尔智家发布2025年三季报,其冰箱业务以47.2%的份额稳居行业第一,份额增量亦为行业最高。面对市场压力,海尔冰箱通过全流程数字化构建了从研发、智造到用户体验的全链路优势:研发端建立AI交互云平台,开创用户共创模式,爆款麦浪系列即为用户共创成果;智造端以AI引领产能提速,工厂支持200多型号柔性生产,每10秒下线一台冰箱;体验端依托全球领先科技,构建满足健康保鲜、厨居一体等需求的爆款矩阵,并通过数字化营销生态实现精准触达。未来,海尔冰箱将以用户为中心持续进化,拓展行业增长空间。

  • 深度数科集团荣膺国家级专精特新“小巨人”,打造数字信任生态新标杆

    近日,山东省工信厅公布第七批国家级专精特新“小巨人”企业名单,深度数科集团凭借在数字信任生态建设方面的创新实践与领先实力成功入选。该集团以“数据+金融+数贸”三位一体为核心路径,推动产业数字化与数据要素化,打通金融资源与商贸流通关键节点,助力产业链从业务协同向数据协同跃升,有效提升全链条资源配置效率和产业韧性。其入选标志着企业在专业化、精细化、特色化、创新性等方面获国家层面权威认可,为同类企业数字化转型提供了可借鉴路径。

  • 海尔智家三季报业绩再创新高:数字化全流程与爆款双引擎驱动

    在“以旧换新”政策热度趋弱、行业普遍增长焦虑的背景下,海尔智家2025年前三季度营收与利润持续增长,创历史新高。其核心优势在于全流程数字化变革:通过数字库存模式提升周转效率,精准营销降低获客成本,智能制造快速响应需求。同时,海外市场多点开花,欧洲份额领先,东南亚增速超15%。数字化非选择题而是必选项,长期坚持变革助力企业在不确定中实现确定性增长。

  • 政策落地·行业转向:装库科技用AI和数字化定义“房地产高质量发展”

    二十届四中全会首次将"推动房地产高质量发展"写入公报,标志着行业正式进入从规模扩张向品质提升转型的关键阶段。装库科技作为代表性企业,通过"AI设计+数字化供应链"双核驱动,构建覆盖新房、二手房、城市更新的全链条服务平台,以售前美化和租前焕新等方案提升房产展示力与交付效率,推动"好房子"理念落地。目前公司已服务全国上千项目,未来将持续深化科技创新,助力实现"好生活""好城市"的高质量发展目标。

今日大家都在搜的词: