据快科技8月26日消息,今晚,阿里云重磅推出全新的多模态视频生成模型通义万相Wan2.2 - S2V,并宣告开源。
Wan2.2 - S2V让视频制作流程大幅简化,只需给出一张静态图片以及一段音频,该模型就能创作出面部表情自然、口型与音频契合度高、肢体动作顺滑流畅的电影级数字人视频。
能够支持分钟级长视频的稳定生成,不仅嘴巴会动,手势、表情、姿态也都可以活动起来。
并且模型在训练时充分发掘跨域泛化能力,能够自然地驱动卡通人物、动物形象、二次元角色、具有艺术风格的人像,不再仅仅局限于真人肖像。
不管是可爱的宠物开口说话,还是动漫角色放声歌唱,Wan2.2 - S2V都能够精确还原音画同步的效果。
它提供480P和720P两种分辨率,兼顾了效率与画质,适用于短视频、数字人、轻量影视等多种场景。
(举报)
