首页 > AI头条  > 正文

阿里Wan 2.2即将震撼上线:开源视频生成AI挑战Sora

2025-07-25 09:22 · 来源: AIbase基地

阿里巴巴云宣布其备受期待的视频生成AI模型Wan2.2即将在近期正式发布。作为Wan2.1的升级版本,Wan2.2预计在性能、效率和功能上实现重大突破,继续秉承阿里开源AI的战略,巩固其在全球AI视频生成领域的领先地位。继Wan2.1于2025年2月开源并取得广泛成功后,Wan2.2的推出引发了开发者社区和行业的热烈讨论。

Wan2.2:技术升级,性能再突破

Wan2.1凭借其时空变分自编码器(VAE)扩散变换器(DiT)架构,已在VBench基准测试中以84.7%的得分超越OpenAI的Sora(84.28%)。据社交媒体讨论,Wan2.2预计进一步优化这些技术,显著提升视频生成速度和质量,尤其是在高分辨率(如1080p)和长视频生成中的表现。 预计新增功能包括:

  • 文本到视频(T2V):支持更高分辨率(如1080p和4K)以及更长的视频生成,生成时间进一步缩短。
  • 图像到视频(I2V):提升动态场景的流畅性和真实性,支持更复杂的动作和场景转换。
  • 视频到音频(V2A):增强从视频内容生成匹配音频的能力,提升多模态创作体验。
  • 多语言与风格扩展:支持更多语言的文本效果生成,并新增多样化的艺术风格模板,如赛博朋克、写实动画等。
  • 硬件优化:进一步降低硬件需求,T2V-1.3B模型预计在更低显存(如6GB)设备上运行,扩大用户覆盖范围。

Wan2.2的训练数据预计在Wan2.1(15亿视频、100亿图像)的基础上进一步扩充,优化数据筛选以提升生成内容的多样性和真实性。

Wan2.2将继续采用Apache2.0许可证,通过Alibaba Cloud ModelScopeHugging Face免费提供代码和模型权重,支持学术研究和商业应用。Wan2.1已推出T2V-1.3B、T2V-14B、I2V-14B-720P和I2V-14B-480P四种变体,Wan2.2预计将新增更多模型变体,针对不同硬件和场景进一步优化。

image.png

开发者对Wan2.2的开源前景充满期待,认为其将进一步挑战OpenAI Sora等封闭模型的市场主导地位,推动AI视频生成技术的民主化。阿里此举不仅降低了技术门槛,也为全球开发者提供了更多创新空间。

  • 相关推荐
  • AI日报:扣子空间网页设计功能上线;阿里Wan 2.2即将上线;​OpenAI即将发布 GPT-5

    【AI日报】今日AI领域重要动态:1)Coze推出网页AI设计功能,5分钟生成网页;2)通义千问发布Qwen-MT翻译模型,支持92种语言;3)ChatGPT全面推出Agent功能;4)阿里云Wan2.2视频生成AI即将上线;5)Anthropic推出审计Agent提升AI对齐测试;6)OpenAI计划8月发布GPT-5;7)谷歌发布无代码AI应用开发工具Opal;8)南洋理工与上海AI Lab推出PhysX-3D项目,为3D模型添加物理属性;9)快手开源KAT-V1大模型,40B版本性能接近DeepSeek-R1;10)讯飞星火X1升级版上线,在多语言和语音处理方面显著提升。(140字)

  • OSWare亮相2025开放原子开源生态大会,深耕开源鸿蒙生态

    2025开放原子开源生态大会于7月23-24日在北京举行,主题为"开源赋能产业,生态共筑未来"。大会设置26场分论坛,汇聚政产学研用金多方资源,推动开源技术发展。OSWare奥思维作为开源鸿蒙生态重要成员参会,分享了基于Kanzi工具链的3D HMI开发方案,该方案能实现高效开发与逼真渲染。大会展示了开源鸿蒙笔记本等创新产品,凸显开源技术在产业升级中的核心价值。工信部副部长熊继军强调开源是培育新质生产力的重要力量,未来将加快开源体系建设,促进技术成果转化应用。

  • 2025WAIC:腾讯地图上线旅游规划Agent,打造一站式智能出行新体验

    腾讯地图在2025世界人工智能大会上推出全新"旅游规划Agent",实现一站式智能出行服务。该AI助手能根据用户需求一键生成个性化旅行攻略,支持深度编辑与灵活调整,整合景点推荐、路线规划、周边探索等功能。创新亮点包括:地图式攻略联动实现"所见即所得"、小红书种草内容智能转化行程、全语音交互操作等。产品覆盖行前规划到行中导航全流程,通过AI技术推动从工具到智能伴侣的升级,让旅行更自由省心。

  • AI日报:阿里通义开源音频生成模型ThinkSound;谷歌Veo3支态图片生成视频;昆仑万维发布 Skywork-R1V 3.0

    【AI日报】今日AI领域重要动态:1)阿里开源支持链式推理的音频生成模型ThinkSound,实现高保真空间音频生成;2)谷歌Veo3升级,支持静态图片生成生动视频;3)Hugging Face发布30亿参数小模型SmolLM3,性能优于Llama-3.2-3B;4)阿里开源网络智能体WebSailor,展现强大推理和检索能力;5)Moonvalley发布原生1080P视频生成模型Marey Realism v1.5;6)Vidu Q1支持最多七张参考图像生成一致性视频;7)苹果�

  • 闪剪AI:一键生成数字人营销视频,助力商家轻松实现内容获客

    闪剪AI是一款专为营销视频制作设计的智能工具,主要解决实体商家和小白用户制作高质量营销视频的痛点。核心功能包括:1)一键生成数字人视频,支持定制专属形象;2)提供1000+数字人模特素材;3)多语种语音克隆,实现本地化内容;4)内置爆款文案素材库;5)智能成片功能简化制作流程;6)照片数字人让静态图片"开口说话";7)直播切片功能实时引流。该工具

  • 《英勇之地》手游S1赛季7月25日开启 宝石之海震撼启航

    《英魂之地》S1赛季"宝石之海"7月25日上线,带来全新海洋主题玩法。包含糖果甜心岛和阳光海域两张新地图,玩家将化身潜艇探索海底世界,挑战圣代霸主、甜心女王等全新BOSS。新增英雄"海女"掌控潮汐之力,独特天赋系统让玩家自由搭配BD套路。这是游戏首次尝试赛季制,主打高沉浸感冒险体验,从甜美糖果到深海暗流,每个设计都体现玩法创新。

  • 智慧养老预告| 让养老更有AI!作为科技邀您共赴WAIC 2025世界人工智能大会

    2025世界人工智能大会(WAIC2025)将于7月26-28日在上海举办,主题为"智能时代 同球共济"。本届大会展览面积首次突破7万平方米,吸引800余家企业参展,展示3000余项前沿展品,涵盖40余款大模型、50余款AI终端、60余款智能机器人及80余款"全球首发"新品。12位诺贝尔奖与图灵奖得主、80余位中外院士、30余国1200位重磅嘉宾将齐聚申城,围绕大模型革命、算力新基建等十大方向展开对话。大会首次将"AI+医疗"列为核心议题,中国主导制定的全球养老机器人国际标准将在会上发布。面对中国3亿老年人口(其中失能半失能老人超4500万)的养老需求痛点,大会将探讨AI赋能智慧养老解决方案,推动"全域数据贯通→精准需求洞察→资源动态调度"闭环,重塑养老产业生态。

  • A日报:B站升级动漫视频生成模型AniSora V3;字节开源4D视频生成框架EX-4D;DeepSWE开源AI Agent系统强势登顶

    AI日报栏目汇总了近期AI领域的重要进展:1)字节跳动开源EX-4D框架,可将单目视频转换为多视角4D视频;2)B站开源动漫视频生成模型AniSora V3,支持多种风格;3)DeepSWE+开源基于Qwen3-32B的AI Agent系统;4)字节开源3亿参数图像编辑模型VINCIE-3B;5)Stability AI推出移动端音频生成模型Stable Audio Open Small;6)谷歌发布免费教育AI工具套件Gemini for Education;7)Topview推出革命性AI数字人带货技术Avatar

  • ING实力 IN挑战 | 2025华为终端硬件精英挑战赛区域决赛全景回顾

    2025年7月5日,华为终端硬件精英挑战赛在六大赛区同步开赛,96支高校战队围绕统一赛题展开激烈角逐。7月10日射频专业赛道线上初赛圆满收官。8月2-3日全国总决赛将在东莞松山湖举行,27支顶尖战队(18支通用赛道区域冠亚季军+9支射频赛道优胜者)将争夺总冠军,优胜者可获5万元奖金及华为面试绿色通道。这场赛事不仅是技术比拼,更是青春与梦想的碰撞,展现了高校硬件精英的创新实力。

  • 字节、腾讯、阿里,AI 编码“三国杀”

    大厂正在集火最具PMF(产品市场契合度)价值的赛道——AI编码。 从7月21日开始,字节、腾讯、阿里轮番更新AI编码产品和模型:字节已有的AI编码产品Trae放出Solo版本,加入上下文工程,让平台变得更“聪明”;腾讯则把一整套用来部署产品的工具放到其中,做了个“全栈工程师”;阿里更是发布编程大模型Qwen3-Coder剑指Claude4,直接从模型层下功夫。 在Cursor面向中国市场取消了An

今日大家都在搜的词: