首页 > 业界 > 关键词  > 阿里云最新资讯  > 正文

阿里开源通义万相2.2:可生成电影级高清视频

2025-07-29 08:23 · 稿源: 快科技

快科技7月28日消息,阿里云宣布旗下通义万相2.2模型正式开源。

通义万相2.2最令人瞩目的,当属其生成电影级高清视频的能力。目前,该模型单次便可生成5秒的高清视频。

这5秒视频绝非普通水准。在光影、色彩、构图以及人物微表情等细节处理上,通义万相2.2达到了专业电影制作的水平。

此次开源,通义万相2.2推出了文生视频(Wan2.2-T2V-A14B)、图生视频(Wan2.2-I2V-A14B)和统一视频生成(Wan2.2-TI2V-5B)三款模型。

值得一提的是,文生视频模型和图生视频模型采用了业界首创的MoE架构,总参数量达27B,激活参数14B。

这两款模型由高噪声专家模型和低噪专家模型协同工作,前者负责搭建视频的整体布局框架,后者专注于完善视频细节,二者配合默契,在同参数规模下,能节省约50%的计算资源,大大提高了模型运行效率。

此外,通义万相2.2还首创电影美学控制系统。这一系统如同一位经验丰富的电影导演,能够精准把控视频中的美学元素。

无论是营造紧张刺激的动作场景氛围,还是刻画浪漫唯美的爱情画面,它都能通过对光影、色彩、构图的精妙调整,让视频呈现出电影般的艺术感染力。

通义万相2.2的开源,为广大创作者、开发者乃至普通用户打开了一扇通往电影级视频创作的大门。

举报

  • 相关推荐
  • 免费生成10秒高清视频!通义App接入通义万相2.5

    在2025云栖大会上,阿里发布通义万相Wan2.5 Preview系列模型,覆盖文生视频、图生视频、文生图和图像编辑四大功能。其视频生成模型首次实现音画同步,可生成匹配画面的人声、音效和BGM,时长从5秒提升至10秒,支持24帧/秒的1080P高清输出,降低影视级创作门槛。模型指令遵循能力增强,支持运镜等复杂连续变化控制。用户通过通义App输入指令即可自动生成10秒高清视频,每日免费使用15次,支持导出无水印视频。同时,图像生成能力全面升级,可生成中英文字符和图表,支持图像编辑功能,一句话即可完成P图。

  • 专业级、电影感还是随手拍?佳能、富士、大疆三款热门Vlog视频机怎么选?

    文章介绍了三款适合Vlog拍摄的热门设备:佳能R50V、富士X-S20和大疆Pocket 3。佳能R50V以轻巧机身(约323克)和6K超采4K视频为核心优势,支持全像素双核自动对焦、专业视频格式及竖屏直播优化,适合日常记录到专业创作。富士X-S20搭载2610万像素APS-C传感器,提供胶片模拟色彩和6.2K视频录制,兼顾画质与便携性。大疆Pocket 3主打稳定拍摄,配备1英寸传感器和三轴云台,支持4K/120fps视频,适合旅行快速出片。三款设备各具特色,满足不同Vlog创作者的需求。

  • AI日报:阿里云开源通义DeepResearch;夸克推医师考试大模型

    本期AI日报聚焦多项前沿动态:阿里云开源轻量级AI代理DeepResearch,性能媲美OpenAI;夸克推出国内首个全阶段医师考试大模型测试集;微软Copilot将上线类ChatGPT记忆管理功能;迪士尼等巨头起诉MiniMax侵犯版权;OpenAI提升ChatGPT搜索准确性;Notion推出个性化AI助手;谷歌发布更小巧高效的时间序列预测模型TimesFM-2.5;Figma推出AI设计功能简化创作流程。整体展现AI技术在开源、医疗、�

  • AI日报:小米开源首个原生端到端语音大模型;通义万相Wan2.2-Animate正式开源;Suno v5即将上线

    AI日报今日聚焦多项技术突破:小米开源首个端到端语音大模型Xiaomi-MiMo-Audio;通义万相推出全新动作生成模型Wan2.2-Animate;Suno即将发布革命性音乐模型v5;生数科技获数亿融资,视频生成技术商业化加速。同时关注OpenAI修复ChatGPT安全漏洞,谷歌将Gemini集成至Chrome浏览器,Luma AI发布支持16位色的Ray3视频生成模型,法国Mistral推出开源推理模型Magistral Small 1.2,Notion发布AI智能体,腾讯混元3D Studio提升3D创作效率。

  • 基于通义万相 美图多款APP上线全新动漫特效、AI变身等视频生成功能

    今日,美图公司旗下美图秀秀、RoboNeo、Wink和开拍等多款产品,推出全新动漫特效、AI变身等视频生成功能。 据悉,新功能基于通义万相系列模型进行深度开发与训练,为美图的全球用户提供全新的创作体验。 近年来,美图加速布局生产力场景,不仅推出面向企业的AI算法服务和解决方案,旗下消费级产品也在快速集成大模型。 去年6月,美图就开始和阿里展开大模型合作。

  • vivo X300系列行业首发4K 60帧电影人像视频:出巨片

    9月26日,vivo举办X系列蓝图影像技术沟通会,正式发布X300系列。该系列首发行业首个4K 60帧电影人像视频,支持人像美颜、虚化及冷胶等多种风格,搭载天玑9500旗舰芯片和自研影像芯片V3+,实现画质、美化和流畅度全面升级。新增冷胶、负片风格,支持双焦段4K 120fps慢动作、杜比视界HDR及10bit Log视频,夜景人像通过“电子柔光箱”算法提升光线柔和度30%,搭配闪光灯和烟花人像算法,软硬协同优化拍摄体验。vivo美学算法升级,蔡司自然人像还原原生感,肌肤纹理立体细腻,经典通透人像更真实清透。

  • 视频拍照不妥协!佳能R50V 4K 视频 + 2420万像素直出,2025 不用二选一

    2025年短视频创作进入专业化时代,佳能R50V作为全新EOS V系列首款机型,以“视频强优化,拍照不妥协”为核心优势。其支持6K超采样4K 30P、4K 60P及全高清120P慢动作,竖屏适配移动端生态,USB直连实现4K 60P直播,并具备2小时持续录制能力。拍照方面搭载2420万像素APS-C传感器,支持15张/秒高速连拍,机身仅323克轻巧便携。R50V兼顾专业视频输出与高质量拍照,满足创作者多场景需求,实现一机双修。

  • AI日报:接入MJ!夸克发布造点AI;Wan2.5-Preview发布;可灵推最新视频生成模型可灵2.5Turbo

    近日AI领域迎来多项重要更新:阿里夸克发布AI创作平台“造点”,整合通义万相Wan2.5与Midjourney V7,支持音画同步视频生成;Wan2.5-Preview实现多模态输入与电影级视频同步生成,提升视觉创作能力;可灵AI推出视频生成模型2.5Turbo并降价30%,降低使用门槛;阿里通义推出Qwen3-ASR-Toolkit,实现小时级音视频转录;谷歌相册AI编辑功能扩展至安卓用户,支持语音修图;谷歌Mixboard工具助力创意设计,生成情绪板;Qwen发布Qwen3-Max模型,在代码生成与智能体能力表现突出;Figma推出MCP服务器,实现设计到代码的一键转换,提升开发效率。

  • 当视频播客陷入“形式之争”,成就UP主才是真正的增量

    随着B站推出“视频播客出圈计划”,抖音、小红书等平台相继加码,名人效应与资源倾斜不断助推着这一内容形态站上风口。与此同时,质疑也随之而来,“播客视频化是否只是一个伪命题?”“到底是视频播客化还是播客视频化?”等议论愈演愈烈。 而在这些争论之外,一个更值得思考的议题正在浮现:当公众在讨论视频播客的概念是否成立时,行业能否借此机会跳出形式之�

  • 女孩神似刘亦菲 三条视频涨粉20万:高度还原“清冷仙气”

    2025年9月,一位广东素人女孩因五官、脸型酷似刘亦菲,仅凭三条短视频在抖音等平台迅速走红。她凭借与刘亦菲高度相似的外貌,短时间内收获超20万粉丝和25.8万点赞,话题热度持续攀升。视频中女孩眉目清冷、鼻梁挺秀,整体气质与刘亦菲颇有几分神似,尤其是眉眼间的神态高度还原了刘亦菲的“清冷仙气”。高辨识度的颜值成为吸引用户的关键因素,网友纷纷自发围观传播,使得视频曝光量呈几何级增长,迅速登上热点榜单。

今日大家都在搜的词: