首页 > AI头条  > 正文

阿里携手北邮推出FantasyPortrait:数字人动画突破,表情迁移与多角色控制再创新高!

2025-07-22 16:58 · 来源: AIbase基地

人工智能在数字人领域的应用持续升温,阿里巴巴联合北京邮电大学近日推出了一项令人瞩目的新项目——FantasyPortrait。这一项目通过创新的表情增强扩散变换器(DiT),实现了单人及多人场景下的复杂情感表达与跨身份表情迁移,为数字人动画技术带来了全新突破。

 FantasyPortrait:数字人动画的革命性突破

FantasyPortrait项目基于表情增强扩散变换器(Expression-augmented DiT)技术,专注于数字人动画的生成与控制。AIbase从社交媒体获悉,该项目能够高效处理单人及多人场景,支持跨身份的表情迁移,并实现复杂情感的精准表达。无论是细腻的微笑还是激烈的愤怒,FantasyPortrait都能以高保真度还原,极大提升了数字人动画的真实感和表现力。

image.png

更令人印象深刻的是,FantasyPortrait在多人场景中能够实现多角色独立表情控制,避免了传统技术中常见的表情串扰问题。这意味着多个数字人可以在同一场景中展现截然不同的表情,而不会相互干扰,为影视制作、虚拟现实和游戏开发等场景提供了强大的技术支持。

 支持多模态驱动,覆盖人物与动物

FantasyPortrait的灵活性是其核心亮点之一。该技术不仅支持人类角色的动画生成,还能处理动物形象,为创意内容创作者提供了更多可能性。此外,项目支持音频驱动功能,用户可以通过音频输入驱动数字人的表情和动作,生成与音频节奏高度同步的动画效果。

AIbase编辑团队认为,这一多模态驱动能力使得FantasyPortrait在虚拟主播、短视频内容创作和互动娱乐领域具有广泛的应用前景。无论是打造虚拟偶像还是生成个性化动画,FantasyPortrait都能提供高效且高质量的解决方案。

 开源承诺,赋能开发者社区

据社交媒体信息,FantasyPortrait的代码和模型预计将在未来开源。这一举措将进一步降低开发者获取尖端数字人技术的门槛,助力全球开发者社区探索和应用这一技术。AIbase注意到,阿里近年来在AI开源领域的持续投入已收获广泛好评,FantasyPortrait的开源计划无疑将进一步巩固其在数字人技术领域的领先地位。

此外,阿里与北京邮电大学的合作也体现了产学研结合的典范。北京邮电大学在通信与AI领域的深厚学术积淀,结合阿里的工程化能力,为FantasyPortrait的研发提供了坚实支撑。

 多场景应用,开启数字人新篇章

FantasyPortrait的推出标志着数字人技术在情感表达和多角色交互上的重大进步。其在影视制作、虚拟现实、游戏开发等领域的潜在应用令人期待。例如,影视制作团队可以利用FantasyPortrait快速生成多角色动画场景,降低制作成本;游戏开发者则可以通过其音频驱动功能打造更具沉浸感的角色互动体验。

AIbase编辑团队认为,FantasyPortrait的创新不仅提升了数字人动画的质量,也为内容创作者提供了更灵活的工具。随着技术的进一步成熟,FantasyPortrait有望成为数字人领域的标杆技术,推动行业迈向新的高度。

结语  

阿里与北京邮电大学联合推出的FantasyPortrait项目,以其在表情迁移、多角色控制和多模态驱动上的突破,为数字人技术开辟了新的可能性。AIbase将持续关注该项目的最新进展和开源动态,为读者带来更多前沿资讯。如果你对数字人动画感兴趣,不妨期待FantasyPortrait的代码发布,亲自体验这一技术的魅力!

项目地址:https://github.com/Fantasy-AMAP/fantasy-portrait

  • 相关推荐
  • 逗哥配音重磅推出“AI分角”功能,革新多角色配音创作体验

    短视频配音工具"逗哥配音"推出革命性"AI分角"功能,通过先进AI算法自动识别剧本中的不同角色及上下文关系,智能分配最适合的发音人进行演绎。该功能将原本需要数小时的人工分拆标注工作缩短至几分钟完成,大幅提升小说推文、沙雕动画等多角色配音内容的创作效率,确保角色配音连贯自然。平台还整合近千种优质发音人、声音克隆等技术,构建覆盖音频创作全流程的一站式智能解决方案,标志着AI语音技术在内容创作领域取得关键突破。

  • A日报:Stability AI发布实时重建模型SPAR3D;火山引擎“奇美拉”数字人平台启动封测;京东重磅开源JoyAgent-JDGenie

    AI日报栏目精选了人工智能领域最新动态:1)Stability AI推出0.7秒单图3D重建模型SPAR3D;2)GitHub热门开源AI协作框架CrewAI获3.4万星;3)马斯克发布儿童AI聊天机器人Baby Grok引发安全争议;4)ComfyUI-C opilot工具简化AI工作流创建;5)CNNIC报告显示我国346款生成式AI完成备案;6)提示词管理工具AI Gist上线;7)开源语言学习工具WordPecker支持多语言学习;8)斯坦福推出多工具协作AI Agent OctoTools;9)Ope

  • 淘宝闪购:日订单量再次突破8000万创新高

    今日,淘宝闪购携手饿了么对外宣布,在订单结构全面向全品类深度拓展的进程中,其日订单量再次实现飞跃,成功突破8000万大关,创下历史新高(该数据不含自提及0元购订单)。 在用户规模方面,淘宝闪购同样表现出色,日活跃用户数在已突破2亿的基础上,本周环比净增15%,显示出强劲的增长势头。与此同时,平台订单准时率稳定在96%,为用户提供了可靠的服务保障。 �

  • 上上签加入日本AILTA,共建可信AI与数字合规新范式

    中国电子签约行业领军服务商上上签电子签约(BestSign)宣布加入日本AI法律技术协会(AILTA),成为该组织正式会员。此举标志着上上签在国际合规生态中的进一步深耕,也意味着其将在AI法律技术和数字签约标准建设中持续发挥"互信合规"的中国方案作用。AILTA是日本LegalTech领域最具代表性的行业协会平台,上上签加入后将与协会在AI合同审查、风险条款识别、数据保护机制等多个方向开展联合研究。上上签CEO万敏表示,加入AILTA是从技术服务走向合规共建的重要一步,未来电子签约比拼的将不仅是功能多少,而是对本地文化、商业伦理、合规诉求的理解深度。

  • AI日报:字节将发布AI编程工具TRAE2.0版本;Mistral重磅推出音频模型Voxtral;月之暗面回应Kimi K2 API速度慢

    AI日报栏目聚焦AI领域最新动态:1)字节跳动将发布TRAE 2.0编程工具,新增语音交互功能;2)Mistral推出开源音频模型Voxtral,支持多语言;3)月之暗面回应Kimi K2API速度慢问题,正在优化系统;4)昆仑万维发布AgentOrchestra框架,实现多智能体协作;5)OpenAI前CTO创立的Thinking Machines Lab获20亿美元融资;6)Kimi-2上线,性能超越GPT-4.1;7)TRAE推出Kimi-K2模型服务,国际版支持Grok-4;8)字节跳动Seed�

  • 如何通过Matrixport结构化理财产品把握加密市场机遇,稳中求胜?

    文章探讨了在通胀上升、就业下降的宏观环境下,投资者面临的挑战和不确定性。重点介绍了Matrixport提供的加密理财产品,如"趋势智赢"和"鲨鱼鳍"等结构化产品,帮助投资者在不同市场环境下实现稳定收益。特别推出创新产品"海鸥",适合单边行情投资,门槛低、灵活性高,能在极端行情中获取高额收益。Matrixport通过多样化产品矩阵满足不同投资者需求,帮助用户在市场波动中灵活调整策略,实现资金增值。未来将继续深耕加密资管领域,为全球用户提供优质理财服务。

  • A日报:Trae 2.0 正式升级 SOLO 模式;通义发布Qwen3新模型;智谱AI重磅推出Zread

    本期AI日报聚焦多项AI领域突破:1)Trae 2.0推出SOLO模式,实现AI全流程自主开发;2)阿里通义发布Qwen3-235B大模型,支持256K文本处理;3)智谱AI推出Zread工具,一键转换GitHub项目为使用手册;4)零一万物发布万智企业大模型平台2.0及定制Agent方案;5)字节跳动推出通用机器人模型GR-3,具备高精度操作能力;6)Pika推出AI视频特效APP,降低创作门槛;7)Dia浏览器将上线AI驱动的"分身鼠标&

  • 阿里云vTrus SSL证书夏季大促,最高直降60%!

    阿里云推出vTrus+SSL证书服务,简化HTTPS部署流程,提升云上证书管理效率。该国产证书已通过国际WebTrust认证,兼容360、奇安信等主流浏览器,并深度参与Tongsuo开源社区建设。2025年7月1日至31日,阿里云推出SSL证书限时优惠活动:GeoTrust证书首购4折起,全系列证书享"新老同享"75折优惠,助力企业实现安全高效的国产化证书部署需求。

  • 小米手表/手环下半年OTA更新计划发布:手表微信应用来了

    今日,小米集团手机部副总裁、可穿戴部总经理张雷发布2025年下半年OTA更新计划,涉及多款小米手表、小米手环、小米耳机,还有最新发布的小米AI眼镜。 下半年OTA更新计划(部分)如下: 手表 REDMI Watch 5系列,预计9月上旬全量推送 支持手表微信应用,社交沟通更及时 REDMI Watch 5 eSIM,预计9月上旬全量推送 支持手表微信应用,社交沟通更及时

  • 一键解决无障碍出行,华人创立的Transreport拿到了英国“国王企业奖”

    伦敦无障碍出行服务公司Transreport荣获2025年度英国"国王企业奖"创新类奖项。该公司由华人创业者沈星杰2015年创立,通过移动App和后台系统为残障人士提供一键预约高铁、机场等场所的照护服务。其创新技术已支持超700万次援助请求,拥有全球100万用户。目前正拓展日本、中东市场,与阪急集团合作将于2025年在日本推出服务。该奖项由英国国王亲自颁发,表彰其在推动交通系统现代化和无障碍出行领域的突出贡献。

今日大家都在搜的词:

热文

  • 3 天
  • 7天