首页 > 业界 > 关键词  > MagicDance最新资讯  > 正文

MagicDance:基于扩散的人体运动传递框架生成逼真舞蹈视频

2024-01-02 11:01 · 稿源:站长之家

站长之家(ChinaZ.com)1月2日 消息:近年来,计算机视觉领域的关键突破之一是MagicDance框架的问世,这是一种基于扩散的模型,旨在彻底改变人体运动传递。MagicDance框架通过两阶段训练策略,聚焦于人体动作解缠和外观因素,为特定目标身份生成逼真的人类舞蹈视频,成为计算机视觉和人工智能领域的新秀。

QQ截图20240102110222.jpg

在计算机视觉领域,人体运动转移一直是一个极具挑战性的任务。虽然现代模型在分析实时场景中的面部特征和物体方面已经取得了显著进展,但人体运动转移依然是一个巨大的挑战。这一任务要求将面部和身体运动从源图像或视频重新定位到目标图像或视频,涉及到复杂的姿势序列和面部表情。

MagicDance框架的独特之处在于其专注于舞蹈视频生成,通过将2D人类面部表情和动作转移到具有挑战性的人类舞蹈视频中,实现了高度逼真的效果。MagicDance采用了稳定扩散模型,结合外观控制和姿势控制,以实现精准而有效的图像到运动传递。该框架在两阶段训练过程中关注外观解缠和肤色、面部表情、服装等外观因素,使其能够生成既逼真又具有原始身份信息的舞蹈视频。

QQ截图20240102110229.jpg

通过在TikTok数据集上进行预训练,MagicDance框架展现了卓越的泛化能力和高质量的生成结果。在外观和运动方面的泛化性表现使得MagicDance框架不仅在复杂的运动序列中表现出色,而且在不同人类身份和面部表情下也能够保持高水准的逼真性。与现有框架相比,MagicDance框架在Face-Cos得分等指标上实现了明显的提升,表明其在保存身份信息和生成逼真舞蹈视频方面具有显著的优越性。

QQ截图20240102110317.jpg

然而,MagicDance框架也面临一些挑战,如在复杂场景中面部标志和姿势骨架检测方面的困难,可能导致生成图像中的伪影。尽管存在一些局限性,MagicDance框架仍然在人体运动传递和舞蹈视频生成领域取得了显著进展,为计算机视觉和人工智能领域带来了新的可能性。

项目地址:https://top.aibase.com/tool/magicdance

举报

  • 相关推荐
  • 字节视频生成模型PixelDance上线即梦AI:用户可免费体验

    字节跳动视频生成模型PixelDance和Seaweed在即梦AI正式上线,面向公众免费开放使用。用户进入即梦AI的视频生成”界面,在视频模型里选择视频P2.0Pro”或视频S2.0Pro”,即可分别体验这两款模型,目前网页版和手机端APP均已支持。平台提供智能画布、故事创作模式,以及首尾帧、对口型、运镜控制、速度控制等AI编辑能力,并有海量影像灵感及兴趣社区,一站式提供用户创意灵感�

  • 荣耀MagicOS 9.0首批公测:荣耀Magic6系列尝鲜

    荣耀MagicOS9.0首批产品开启公测,覆盖机型包括荣耀MagicV3、荣耀MagicVs3、荣耀MagicV2系列、荣耀Magic6系列、荣耀Magic5系列等等,其它机型将陆续开启,敬请期待。荣耀MagicOS9.0带来了全新升级的魔法大模型家族,包括语言大模型、图像大模型、语音大模型、多模态大模型四个大模型矩阵,实现了在不同设备上的灵活部署。全新升级的灵动胶囊在应用场景和服务体验上进一步扩展,全面覆盖航班、打车、高铁、快递、外卖、观影、游戏、系统服务、本地生活、导航、安全、通信等高频场景。

  • 荣耀MagicOS 9.0第二批内测招募来了:11月8日启动 支持Magic Vs2等

    今日,荣耀发布MagicOS9.0最新升级适配进展,公布首批升级产品内测增推及公测计划以及第二批升级产品内测计划。具体如下:首批升级产品内测增推及公测计划已增推所有前期已报名内测的用户,计划11月13日启动公测。荣耀MagicOS9.0是行业首个搭载智能体的个人化全场景AI操作系统,在MagicOS9.0中,YOYO助理全面升级为YOYO智能体,支持自动执行多项任务,以及多项AI功能提升。

  • 荣耀Magic7价格解读 多项配置均为同档位少有

    在不久之前的发布会上,荣耀Magic7价格正式公布,起售价4499元,起步内存为12GB256GB。在原材料成本不断上涨的年代,这个价格对于旗舰手机来说并不算高。如果近期有换机需求,并且想要一款旗舰级产品,那么无论是荣耀Magic7标准版还是荣耀Magic7Pro都很值得选择。

  • 荣耀双11战报出炉:包揽多项冠军 Magic7“赢麻了”

    昨晚8点,双11终于迎来了最后的高潮期。荣耀也第一时间发布了战报,拿下了多项冠军,其中Magic7简直是赢麻了”,成为近期最强新品。具体如下:荣耀Magic7获天猫、京东、抖音、快手平台新品手机销量冠军;荣耀MagicVs3获京东平台大折叠手机销量冠军;荣耀X60获京东平台1000-1500元价位段快手平台单品销量冠军;荣耀MagicBookPro16获天猫、京东平台独显轻薄本销量冠军;荣耀平板家族GMV同比增长70%;荣耀穿戴家族GMV同比增长130%;荣耀亲选全品类GMV同比增长100%。

  • AI版《黑客帝国》:无限生成逼真视频,3A画质,还能实时交互

    人类离电影《黑客帝国》的场景,似乎又近了一步。因为就在刚刚,一个与电影同名的、首个AI基础世界模拟器——TheMatrix问世。若是大家对研究感兴趣,可戳下方链接查看详情。

  • 荣耀Magic7 RSR 保时捷设计入网:支持双卫星通信

    日前,型号为PTP-AN20”的荣耀新机通过工信部电信设备进网许可,新机预计为荣耀Magic7RSR保时捷设计。进网许可显示,荣耀Magic7RSR保时捷设计支持天通卫星和北斗三号短报文,即双卫星通信。据数码博主数码闲聊站”爆料,荣耀Magic7RSR保时捷设计主打影像,搭载OV50K可变光圈主摄和2亿像素潜望镜。

  • 索尼 A1 II 配备专用 AI 处理器和精致的人体工程学设计

    时隔近四年,索尼推出了备受期待的A1II无反光镜相机,弥补了前代产品在功能上的短板,并通过借鉴A7RV和A9III的设计改进,使其在旗舰级市场中重新占据领先地位。A1II依旧采用全堆叠5010万像素CMOS传感器,但搭载了全新AI处理单元,带来了显著的性能提升和用户体验优化。A1II和新镜头将于12月上市,售价分别为6500美元和2900美元。

  • Kimi内测AI视频生成功能: 每天可免费生成100秒视频

    据报道,Kimi目前正内测AI视频生成功能Kimi创作空间”,可通过12种预设风格模板和自定义创作功能,为用户制作个性化音乐视频。Kimi创作空间”目前正处于灰度测试阶段,预示着它距离正式亮相已为期不远。无论是专业学术论文的翻译与理解是法律问题的辅助分析,亦或是发票的批量整理以及API开发文档的快速解读,Kimi都展现出了出色的表现,赢得了广大用户的一致好评。

  • 迄今最大视频开源模型!腾讯混元文生视频上线:一句话生成视频

    今日,腾讯混元大模型宣布文生视频功能上线,一句话就能生成视频。此次开源的视频生成大模型,参数量130亿,是当前最大的视频开源模型。通过先进的图像视频混合VAE,让模型在细节表现有明显提升,特别是小人脸、高速镜头等场景。

热文

  • 3 天
  • 7天