首页 > 业界 > 关键词  > 阿里云最新资讯  > 正文

阿里开源通义万相2.2:可生成电影级高清视频

2025-07-29 08:23 · 稿源: 快科技

快科技7月28日消息,阿里云宣布旗下通义万相2.2模型正式开源。

通义万相2.2最令人瞩目的,当属其生成电影级高清视频的能力。目前,该模型单次便可生成5秒的高清视频。

这5秒视频绝非普通水准。在光影、色彩、构图以及人物微表情等细节处理上,通义万相2.2达到了专业电影制作的水平。

此次开源,通义万相2.2推出了文生视频(Wan2.2-T2V-A14B)、图生视频(Wan2.2-I2V-A14B)和统一视频生成(Wan2.2-TI2V-5B)三款模型。

值得一提的是,文生视频模型和图生视频模型采用了业界首创的MoE架构,总参数量达27B,激活参数14B。

这两款模型由高噪声专家模型和低噪专家模型协同工作,前者负责搭建视频的整体布局框架,后者专注于完善视频细节,二者配合默契,在同参数规模下,能节省约50%的计算资源,大大提高了模型运行效率。

此外,通义万相2.2还首创电影美学控制系统。这一系统如同一位经验丰富的电影导演,能够精准把控视频中的美学元素。

无论是营造紧张刺激的动作场景氛围,还是刻画浪漫唯美的爱情画面,它都能通过对光影、色彩、构图的精妙调整,让视频呈现出电影般的艺术感染力。

通义万相2.2的开源,为广大创作者、开发者乃至普通用户打开了一扇通往电影级视频创作的大门。

举报

  • 相关推荐
  • 长视频,要MCN化?

    过去十多年,长视频平台习惯用头部综艺与大剧撬动增长:内容够强,自然破圈,声量带动会员与广告。 这套“内容中心逻辑”曾行之有效。 但短视频重写了注意力分配。用户不再愿意投入整段时间追一个叙事,三十秒的情绪刺激就足以满足娱乐需求。内容生命周期被压缩,哪怕是重金制作,也可能上线当周见顶、难以延展。 在这种环境下,平台不得不寻找新的增长方式。�

  • 拍照视频,无需妥协:佳能R50V以全能双修定义创作新标准

    佳能R50V以“全能双修”定位成为市场焦点,在视频与摄影两大核心维度表现均衡专业。搭载2420万像素APS-C画幅CMOS与DIGIC X处理器,支持6K超采4K录制及专业格式,配备10bit色深。机身仅重323克,新增竖拍优化与14种滤镜,支持USB一线连播。具备1/8000秒快门与第二代全像素双核AF系统,可精准识别多类主体。配合RF-S电动变焦镜头实现广角自拍,覆盖Vlog、直播、人像等多场景,以约6000元定价降低专业创作门槛,成为内容创作者的热门选择。

  • 短视频加速跑入AI时代

    「现在是西天取经的第996天,刚把师父从妖怪嘴里救出来,师父身上都还是热乎的,我们就马不停蹄开始出发了。」在抖音,都能看到《西游记》里师徒四人的取经vlog了。 采访高考完刚出考场的爱因斯坦、孟德尔、门捷列夫;慈溪逛颐和园Vlog、大禹治水现场直播,各种AI生成的视频成为网友「玩梗搞抽象」的核心生产力。 尽管在专业影视

  • Sora App的AI视频社交,给了百度们新希望

    Sora2发布两周后,百度的蒸汽机AI视频模型,和谷歌Veo3.1撞了档期。 两家公司选择同期发布并非有多默契,而是Sora2带来的压迫感促使它们不得不加快脚步。 奥尔特曼将形容Sora2为“创意领域的ChatGPT3.5时刻”,不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃,还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。 这无疑是扔在AI视�

  • 保洁阿姨拍“土味说车”视频出圈:一口地道的东北话

    近日,哈尔滨一家雷克萨斯汽车经销店的保洁阿姨凭借一条“土味说车”视频在网络上迅速走红。“老板买车吗?这大轱辘你喜欢吗?黢黑式轮毂喜欢吗?”阿姨一口地道的东北话,搭配着并不十分娴熟的车辆专业术语,这种反差萌受到了众多网友的喜爱。 这位出镜的保洁阿姨今年58

  • 一机在手,随心创作:佳能R50V满足你对Vlog、人像与美食视频的所有想象

    佳能R50V微单相机专为视频创作者设计,兼具专业画质与便携性。机身仅重323克,支持6K超采4K视频,配备第二代全像素双核AF系统,可智能追踪人物、动物等多种主体。内置14种色彩滤镜与平滑皮肤功能,优化人像表现。创意拍摄模式支持慢快动作、电影宽银幕比例,竖拍优化与直播兼容性进一步提升创作效率,是Vlog、旅拍和街拍的理想工具。

  • 爆火!58岁保洁阿姨拍“土味说车”视频出圈:这黢黑大轱辘你喜欢吗

    老板买车吗”硬派大越野子”这大底盘子,还能伸进一个小腿呢”。 近日,哈尔滨一雷克萨斯汽车经销店的保洁阿姨,因 土味说车” 视频意外走红网络。 这位阿姨今年58岁,自2019年起就在该门店从事保洁工作,视频里她用一口地道的东北话介绍车辆,还夹杂着 黢黑的大轱辘”6 个桶子(6 个缸)3.5 的 T”双关轮子增压(双涡轮增压)” 等不娴熟却接地气的表述。 阿姨说车

  • Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

    SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。

  • 做乐园,长视频拥抱线下的终极大考

    如果说过去十年中国长视频平台的竞争重点一直在“内容规模”、“会员数”与“时长争夺”这些线上指标上,那么进入2024–2025年之后,这场竞争的重心,正在悄然转向“线下”。 随着短视频、短剧对注意力的强势分流,用户的付费意愿、广告主的投放信心以及内容本身的价值空间都在被压缩,单纯依靠“剧好看”、“综艺够爆”已经无法支撑起平台增长的想象力。 一个�

  • AI日报:HeyGen发布AI视频翻译引擎;科大讯飞推星火 X1.5;QQ浏览器推出AI+小窗

    本期AI日报聚焦多项技术突破:HeyGen推出精准唇形同步的视频翻译引擎;科大讯飞发布星火X1.5大模型,提升多语言处理能力;QQ浏览器新增AI助手浮窗;科大讯飞推出软硬一体方案,实现高噪声环境精准识别;谷歌Gemini 3 Pro预览版支持百万级上下文窗口;Comfy Cloud让Stable Diffusion实现零门槛创作;谷歌Gemini新增深度研究功能,可整合邮件生成智能报告;上海AgiBot机器人10分钟完成复杂制造任务,重塑生产效率。

今日大家都在搜的词: