首页 > AI头条  > 正文

阿里发布Animate Anyone 2:轻松实现视频人物替换、动作表情无缝迁移

2025-02-13 10:26 · 来源: AIbase基地

近日,阿里巴巴 发布了其最新技术成果 Animate Anyone2,这项突破性技术可实现视频人物的精准替换。根据项目官网公布的案例展示,用户只需提供原始视频与目标角色图像,系统即可在保留原视频动作轨迹的基础上,完成人物形象的实时替换。

实验数据显示,系统可将足球运动员的射门动作完整迁移至动画角色,同时保留球体运动轨迹的真实物理特性。针对影视制作中的复杂需求,该系统还支持自定义光照调节与背景环境适配,实现人物与场景的深度融合。

image.png

该系统搭载的动态骨骼绑定技术,通过精确追踪人体28个关键骨骼点,能准确捕捉肢体运动轨迹与面部微表情。在公开测试视频中,无论是舞蹈演员的连续旋转动作,还是武术动作中的快速腾挪,替换后的角色都能保持动作连贯性。

在技术层面上,该系统采用了一种形状无关的掩模策略,能够更有效地描述角色与环境之间的关系。同时,为了增强角色与周围物体之间的互动,Animate Anyone2引入了轻量级的物体引导器。该引导器负责提取与角色互动的物体特征,并通过空间融合技术将这些特征注入到去噪过程中。这样的设计使得角色在运动时与环境及物体的互动显得更加流畅和真实。

实验结果显示,Animate Anyone2在生成具有环境适应性的角色动画方面表现出色。与目前市场上的同类产品,如 Viggle 和 MIMO 相比,Animate Anyone2在角色的一致性、细节保留和互动的真实性上都展现出更高的水平。这标志着角色动画技术的发展迈向了新的高度。

image.png

image.png

随着 Animate Anyone2的推出,角色动画在游戏、影视制作和虚拟现实等多个领域的应用潜力进一步扩大。它不仅为动画制作人提供了更强大的工具,也为观众带来了更加生动、真实的视觉体验。

项目:https://humanaigc.github.io/animate-anyone-2/

划重点:

🌍 Animate Anyone2通过捕捉环境特征,实现角色与环境之间的真实互动。

🎨 新技术引入物体引导器和空间融合,提升角色与物体的交互效果。

🚀 相较于同类技术,Animate Anyone2在细节和一致性方面展现出明显优势。

  • 相关推荐
  • 阿里开源通义万相2.2:可生成电影级高清视频

    阿里云宣布旗下通义万相2.2模型正式开源。 通义万相2.2最令人瞩目的,当属其生成电影级高清视频的能力。目前,该模型单次便可生成5秒的高清视频。 这5秒视频绝非普通水准。在光影、色彩、构图以及人物微表情等细节处理上,通义万相2.2达到了专业电影制作的水平。 此次开源,通义万相2.2推出了文生视频(Wan2.2-T2V-A14B)、图生视频(Wan2.2-I2V-A14B)和统一视频生成(Wan2.2-TI2V-

  • Matrixport CEO John 出席 Foresight 2024 年度峰会,表示Matrixport将持续拥抱合规,提供专业资管服务

    Matrixport CEO John Ge在"Foresight2024"峰会上表示,合规化是加密行业主旋律。他指出当前加密市场缺乏新流量入场,资产管理趋向主流资产集中化,BTC、ETH等占比很高。随着加密ETF通过,合规属性增强,跨圈资管开始复苏。Matrixport将持续拥抱合规,为更多用户提供专业资管服务,帮助用户获取理性收益。公司成立于2019年,是亚洲最大的一站式加密金融服务平台,致力于构建�

  • TECNO发布全球最薄三折概念机PHANTOM Ultimate G Fold

    TECNO发布PHANTOM Ultimate G Fold概念机,采用创新双屏内折设计,配备9.94英寸柔性大屏,折叠状态下厚度仅11.49mm,展开后最薄处3.49mm,刷新三折手机轻薄纪录。其核心创新在于独特的G型三折结构,通过左右双内折实现屏幕完全内藏保护,并配备外屏保证折叠状态下的常规使用体验。该机采用精密双铰链系统,支持多角度悬停,搭配2000MPa高强度钢铰链和0.3mm超薄钛纤维背板,兼顾强度与轻薄。量产版将搭载高性能芯片、多焦段三摄系统和超5000mAh电池,重新定义旗舰折叠屏体验。

  • AI日报:火山引擎发布豆包3.0;通义开源Qwen3非思考模型;谷歌偷偷升级Imagen 4

    【AI日报】栏目聚焦人工智能领域最新动态:1)火山引擎发布豆包系列AI模型升级,包括图像编辑3.0、同声传译2.0等;2)通义千问开源Qwen3-30B模型,支持多语言处理;3)OpenAI推出ChatGPT Study学习助手;4)中国发布HYPIR图像复原大模型;5)谷歌NotebookLM新增视频概览功能;6)谷歌Imagen4图像生成模型升级,性能媲美GPT-4o;7)昆仑万维开源多模态模型Skywork UniPic;8)理想汽车发布首搭VLA大模型的i8纯电SUV;9)谷歌在英国推出AI搜索模式;10)OWL团队开源多智能体协作工具;11)2025年用户增速最快APP榜单显示DeepSeek等AIGC应用表现突出。

  • 从数字世界迈向物理世界!清华×生数发布最新成果Vidar,基于视频大模型实现机器人物理操作

    清华大学生数科技团队研发的Vidar模型实现具身智能重大突破,首次让通用视频大模型具备"手脚"功能。该模型通过三级数据架构(海量通用视频+中等规模具身视频+少量机器人特定数据),仅需20分钟机器人真机数据即可快速泛化到新机器人本体,数据量仅为行业领先方法的1/80-1/1200。Vidar创新性地将任务解构为上游视频预测和下游动作执行,结合逆动力学模型实现视觉-

  • AI日报:智谱AI重磅发布GLM-4.5;阿里开源Wan2.2;阶跃星辰推全新模型Step3

    【AI日报】本期重点内容:1.智谱AI发布开源大模型GLM-4.5,在推理、编码和智能体能力方面达到SOTA水平;2.阿里开源视频生成模型Wan2.2,采用MoE架构提升计算效率;3.阶跃星辰推出AI研究助手"阶跃深研",支持金融医疗等专业领域研究;4.微软Edge浏览器新增Copilot模式,提供智能搜索体验;5.Anthropic对Claude用户实施使用限制引发争议;6.阶跃星辰发布321B参数大模型Step3;7.蚂�

  • 三下乡投稿视频媒体平台|学习 强国央视频人民视频投稿

    文章介绍了高校如何在权威媒体平台高效投放宣传视频的三大推荐渠道:1)"学习 强国"平台,适合党政类内容;2)央视视频平台,作为国家级5G新媒体平台;3)人民日报旗下人民视频。建议通过第三方服务机构【猎媒传播】投稿,可1-3天快速审核发布。视频要求MP4格式,大小不超过200M,时长1-3分钟,可配300-500字简介。

  • AI日报:GPT-5-Auto现身Mac客户端;阿里开源WebAgent项目WebShaper;腾讯推X-Omni多模态模型

    【AI日报】今日AI领域重要动态:1)阿里开源WebAgent项目WebShaper,GAIA评测超越Claude4-Sonnet;2)Moonvalley推出草图转视频功能,支持手绘生成电影级视频;3)腾讯X-Omni模型实现图文理解重大突破;4)百度搜索测试AI应用中心入口;5)Midjourney+新增个性化推荐功能;6)GPT-5或于2025年夏季发布;7)Ollama推出桌面客户端;8)OWL团队开源多智能体协作工具Eigent;9)OpenAI年收入激增至120亿美元;10)英伟达H20芯片因安全风险被约谈;11)万兴科技天幕2.0模型国内排名第四,与华为云共建AI视频实验室。

  • 微信朋友圈评论区能发表情包和图片:缓存可清理 不会太占用存储空间

    上个月,微信开始灰度测试朋友圈评论区带图功能,支持用户用表情包和图片进行评论。 有网友表示,微信现在评论可以带图了,我想知道评论区的图片会不会缓存下来占用我的手机空间。 对此,微信员工客村小蒋表示,在讨论微信占空间时,有两种需要区分的数据:可再生数据和非可再生数据。

  • A日报:Kimi开放平台上线Kimi Playground;OpenAI重磅发布ChatGPT Agent;Suno推人声替换功能

    【AI日报】汇总了近期AI领域重要进展:1)月之暗面推出Kimi Playground平台,实现从对话助手到智能助理的转变;2)OpenAI发布ChatGPT Agent,支持自主执行浏览、购物等任务;3)Suno发布v4.5+版本,新增人声替换等音乐创作功能;4)谷歌Veo3视频生成模型上线,支持文本转视频;5)全球首个直播流扩散模型MirageLSD发布,实现实时视频转换;6)VSCode编程助手Traycer提升大型代码库处理效率;7)ART框架支持Python一键训练AI Agent;8)NVIDIA语音识别模型Canary-Qwen-2.5B词错率创新低;9)Mistral AI推出Le Chat挑战ChatGPT;10)百度小度上线首个支持物理交互的MCP Server;11)Lightricks的LTXV模型实现60秒高质量视频生成;12)开源模型LTX-Video13B支持30倍速高清视频生成。

今日大家都在搜的词: