阿里Wan2.2-S2V正式发布：一张图+一段音频即可生成人物动态视频

2025-08-27 08:34 · 稿源：快科技

据快科技8月26日消息，今晚，阿里云重磅推出全新的多模态视频生成模型通义万相Wan2.2 - S2V，并宣告开源。

Wan2.2 - S2V让视频制作流程大幅简化，只需给出一张静态图片以及一段音频，该模型就能创作出面部表情自然、口型与音频契合度高、肢体动作顺滑流畅的电影级数字人视频。

能够支持分钟级长视频的稳定生成，不仅嘴巴会动，手势、表情、姿态也都可以活动起来。

并且模型在训练时充分发掘跨域泛化能力，能够自然地驱动卡通人物、动物形象、二次元角色、具有艺术风格的人像，不再仅仅局限于真人肖像。

不管是可爱的宠物开口说话，还是动漫角色放声歌唱，Wan2.2 - S2V都能够精确还原音画同步的效果。

它提供480P和720P两种分辨率，兼顾了效率与画质，适用于短视频、数字人、轻量影视等多种场景。

（举报）

相关推荐

关键词：

长视频，要MCN化？

过去十多年，长视频平台习惯用头部综艺与大剧撬动增长:内容够强，自然破圈，声量带动会员与广告。这套“内容中心逻辑”曾行之有效。但短视频重写了注意力分配。用户不再愿意投入整段时间追一个叙事，三十秒的情绪刺激就足以满足娱乐需求。内容生命周期被压缩，哪怕是重金制作，也可能上线当周见顶、难以延展。在这种环境下，平台不得不寻找新的增长方式。�

文章搜索核心标签长视频平台
荐短视频加速跑入AI时代

「现在是西天取经的第996天，刚把师父从妖怪嘴里救出来，师父身上都还是热乎的，我们就马不停蹄开始出发了。」在抖音，都能看到《西游记》里师徒四人的取经vlog了。采访高考完刚出考场的爱因斯坦、孟德尔、门捷列夫;慈溪逛颐和园Vlog、大禹治水现场直播，各种AI生成的视频成为网友「玩梗搞抽象」的核心生产力。尽管在专业影视

文章搜索核心标签 AI生成
荐Sora App的AI视频社交，给了百度们新希望

Sora2发布两周后，百度的蒸汽机AI视频模型，和谷歌Veo3.1撞了档期。两家公司选择同期发布并非有多默契，而是Sora2带来的压迫感促使它们不得不加快脚步。奥尔特曼将形容Sora2为“创意领域的ChatGPT3.5时刻”，不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃，还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。这无疑是扔在AI视�

文章搜索核心标签 AI视频模型
打造“智慧应急”中枢大脑！itc保伦股份LED显示屏、数字会议、远程视频会议等系统全面应用于汶上县应急指挥部

汶上县应急指挥中心由ITC保伦股份携手打造，现已全面投入使用。该中心整合了公安、水务、气象等20多个部门的视频信号，实现八大功能“一张图、一个网、一键操作”，显著提升了全县风险应对能力。系统采用LED显示屏、数字会议、专业扩声等先进设备，构建了智能可视化应急管理平台，支持多平台信息联动与远程视频会商，助力形成统一指挥、反应灵敏的应急体系，并荣获省级先进荣誉，为公共安全治理现代化提供了有力技术支撑。

应急管理应急救援安全生产
荐AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏览器推出AI+小窗

本期AI日报聚焦多项技术突破：HeyGen推出精准唇形同步的视频翻译引擎；科大讯飞发布星火X1.5大模型，提升多语言处理能力；QQ浏览器新增AI助手浮窗；科大讯飞推出软硬一体方案，实现高噪声环境精准识别；谷歌Gemini 3 Pro预览版支持百万级上下文窗口；Comfy Cloud让Stable Diffusion实现零门槛创作；谷歌Gemini新增深度研究功能，可整合邮件生成智能报告；上海AgiBot机器人10分钟完成复杂制造任务，重塑生产效率。

AI视频翻译唇形同步跨语言本地化
荐AI日报：Lovart AI上线“元素拆分”功能；Xcode 26.1.1发布；阿里云通义模型首次大规模赋能双11

本期AI日报涵盖八大热点：Lovart AI推出"元素拆分"功能，实现海报智能分层编辑；苹果Xcode 26.1.1优化AI编码性能；阿里云通义模型双11单日翻译调用量突破14亿次；Gemini 3在历史手稿破译中展现专家级能力；德国法院裁定OpenAI使用歌词训练构成侵权；开源语音模型Maya1实现富有表现力的实时文本转语音；Meta首席AI科学家LeCun计划离职创办世界模型公司；AI专家罗福莉加入小米，将致力于构建物理世界智能。

AI设计元素拆分海报编辑
简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

广州简知科技自主研发的“简智AI大模型”通过国家生成式人工智能服务备案，标志着该模型在安全性、合规性与可靠性方面达到国家级标准。作为兴趣教育领域AI应用的重要里程碑，该模型围绕用户兴趣成长周期设计，提供个性化学习支持：可为未明确兴趣方向的用户智能推荐内容，为入门用户规划学习路径，为基础扎实用户提供进阶训练与智能反馈。其技术能力在旗下“简小知”等品牌中已实现“学—练—评—测”全流程覆盖，并通过社群互动增强学习动力。公司未来将持续优化模型能力，联合行业伙伴构建完整培养体系，推动兴趣教育向个性化、高质量方向发展。

简智AI大模型生成式人工智能兴趣教育
从SEO到GEO的范式革命，《生成式AI时代品牌战略指南》白皮书正式发布

11月4日，《生成式AI时代+品牌战略指南》白皮书发布，聚焦企业AI搜索优化需求。白皮书提出GEO全链路解决方案，结合E-E-A-T信任框架和3C指导法则，帮助企业破解AI搜索覆盖率低、合规风险高等痛点，推动从流量竞争转向价值竞争，构建可持续增长生态。

AI搜索优化生成式AI 品牌战略
拍照视频，无需妥协：佳能R50V以全能双修定义创作新标准

佳能R50V以“全能双修”定位成为市场焦点，在视频与摄影两大核心维度表现均衡专业。搭载2420万像素APS-C画幅CMOS与DIGIC X处理器，支持6K超采4K录制及专业格式，配备10bit色深。机身仅重323克，新增竖拍优化与14种滤镜，支持USB一线连播。具备1/8000秒快门与第二代全像素双核AF系统，可精准识别多类主体。配合RF-S电动变焦镜头实现广角自拍，覆盖Vlog、直播、人像等多场景，以约6000元定价降低专业创作门槛，成为内容创作者的热门选择。

佳能R50V 全能双修视频与拍照
美食视频神器？佳能R50V用清晰画质与诱人色彩，让你随手一拍即专业

佳能R50V相机凭借卓越画质与色彩表现，成为摄影爱好者的得力伙伴。其针对人像、美食、街头三大高频场景深度优化：人像拍摄可呈现自然通透肤色，五级平滑皮肤模式保留肌理细节；美食记录通过2420万像素传感器与14种色彩滤镜，精准还原食材质感与诱人色泽；323克轻巧机身配合高速对焦系统，轻松捕捉街头瞬间。相机以“拍得好、美、轻松”为核心，精准满足用户日常拍摄需求，让高质量影像记录变得简单愉悦。

佳能R50V 半画幅相机人像拍摄

今日大家都在搜的词：

热文

3 天
7天

阿里Wan2.2-S2V正式发布：一张图+一段音频即可生成人物动态视频

长视频，要MCN化？

荐短视频加速跑入AI时代

荐Sora App的AI视频社交，给了百度们新希望

打造“智慧应急”中枢大脑！itc保伦股份LED显示屏、数字会议、远程视频会议等系统全面应用于汶上县应急指挥部

荐AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏览器推出AI+小窗

荐AI日报：Lovart AI上线“元素拆分”功能；Xcode 26.1.1发布；阿里云通义模型首次大规模赋能双11

简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

从SEO到GEO的范式革命，《生成式AI时代品牌战略指南》白皮书正式发布

拍照视频，无需妥协：佳能R50V以全能双修定义创作新标准

美食视频神器？佳能R50V用清晰画质与诱人色彩，让你随手一拍即专业

今日大家都在搜的词：

热文

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

雷军回应小米双11战绩：谢谢大家支持

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

卢伟冰：小米手机双11连续三年国产销量第一

焕新享界S9开卖72小时预订突破8000台

OPPO Reno15系列定档11月17日发布

华为Mate 70 Air维修备件价格公布：换主板2499元

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.

特斯拉磁悬浮Cybertruck车模上架中国官网售价999元

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

雷军回应小米双11战绩：谢谢大家支持

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

OPPO Reno15系列官宣11月10日发布

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

卢伟冰：小米手机双11连续三年国产销量第一

焕新享界S9开卖72小时预订突破8000台

OPPO Reno15系列定档11月17日发布

华为Mate 70 Air维修备件价格公布：换主板2499元

站长商机

阿里Wan2.2-S2V正式发布：一张图+一段音频 即可生成人物动态视频

今日大家都在搜的词：

热文

站长商机

阿里Wan2.2-S2V正式发布：一张图+一段音频即可生成人物动态视频