首页 > AI头条  > 正文

阿里通义发布 Wan2.2-I2V-Flash 图生视频模型 推理速度大幅提升

2025-08-11 16:06 · 来源: AIbase基地

阿里通义大模型今日宣布推出其最新图生视频模型Wan2.2-12V-Flash,该模型的上线将为用户带来更快速、更专业、更稳定的视频生成体验。

Wan2.2-12V-Flash在保持电影级视觉呈现的同时,实现了生成速度与性价比的全面提升。此次发布的Wan2.2-12V-Flash模型在推理速度上相比前代Wan2.1提升了12倍,显著提高了创作效率。新模型的指令遵循能力也得到了大幅提升,能够直接响应各种特效提示词,实现运镜的精准控制,确保指令的准确执行。

微信截图_20250811160558.png

此外,Wan2.2-12V-Flash能够稳定输出风格化的图像,并为这些图像添加合理自然的动态效果,无论输入的是哪种风格化图像,都能保持其独特风格。

Wan2.2-12V-Flash的发布,不仅在功能上进行了升级,还在速度、成本、稳定性和表现力上展现了其优势。新模型的价格低至0.1元/秒,抽卡成功率相比Wan2.1提升了123%,为用户提供了更具性价比的选择。

阿里云百炼平台现已开放Wan2.2-12V-Flash模型的API调用,用户可以登录阿里云百炼平台体验这一全新模型的强大功能。随着Wan2.2-12V-Flash的推出,视频内容创作者将能够以更低的成本和更高的效率创作出高质量的视频内容,进一步推动数字媒体和娱乐行业的发展。

  • 相关推荐
  • 阿里通义App重大品牌升级!正式更名为“千问”

    11月14日,阿里巴巴旗下“通义”App正式更名为“千问”,版本号从3.60.0跃升至5.0.0,已登陆苹果及各大安卓应用商店。该应用基于阿里最强Qwen大模型打造,具备对话问答、智能写作、多模态相机等核心功能,被定位为“阿里最强大模型官方AI助手”。阿里巴巴视其为“AI时代的未来之战”,已抽调上百名工程师加速推进,并同步研发国际版,计划借助Qwen模型的海外影响力与ChatGPT直接争夺全球用户。

  • AI日报:Lovart AI上线“元素拆分”功能;Xcode 26.1.1发布;阿里云通义模型首次大规模赋能双11

    本期AI日报涵盖八大热点:Lovart AI推出"元素拆分"功能,实现海报智能分层编辑;苹果Xcode 26.1.1优化AI编码性能;阿里云通义模型双11单日翻译调用量突破14亿次;Gemini 3在历史手稿破译中展现专家级能力;德国法院裁定OpenAI使用歌词训练构成侵权;开源语音模型Maya1实现富有表现力的实时文本转语音;Meta首席AI科学家LeCun计划离职创办世界模型公司;AI专家罗福莉加入小米,将致力于构建物理世界智能。

  • AI日报:阿里千问APP公测;Veo 3.1上线多图参考;超级小爱AI大模型“随心修图”上线

    本期AI日报聚焦多项技术突破:阿里千问APP公测,基于Qwen3模型对标ChatGPT;谷歌Veo 3.1支持三图融合生成8秒视频;小米推出"随心修图"功能与7B多模态模型Miloco;谷歌Flow集成Nano Banana模型实现智能抠图;多模态AI工具DeepEyesV2可执行代码与网络搜索;NotebookLM升级支持图像导入检索;JetBrains推出DPAI Arena测试编码AI性能。全球AI竞争持续升温,产品迭代加速。

  • 阿里夸克AI眼镜S1宣布11月27日发布

    阿里巴巴旗下首款旗舰双显AI眼镜夸克AI眼镜S1将于11月27日上市。产品融合前沿显示、拍摄与交互技术,以双目光机二维衍射波导方案实现低反光率高透性视觉体验,支持环境光智能调节与自定义显示位置。搭载索尼IMX681传感器与1200万超广角镜头,具备极速抓拍、3K视频及超级夜景功能。创新双电池架构与MiniBag换电仓解决续航痛点,支持手势与语音双操作。集成高德导航、支付宝“看一看”支付及办公辅助工具,通过眨眼或语音即可完成路线查询与快捷支付,覆盖生活全场景智能生态。

  • AI日报:上海首例涉AI提示词著作权案宣判;Kimi K2 Thinking发布;中文图像编辑新王UniWorld-V2发布

    今日AI领域动态:上海首例AI提示词著作权案宣判,法院认定提示词不具独创性;月之暗面发布Kimi K2思考模型,实现自主多轮工具调用;UniWorld-V2图像编辑模型支持中文框选即改,性能超越GPT-Image;谷歌推出AI文件检测工具Magika 1.0,支持超200种格式;Sora安卓版首日下载量达47万次;我国发布全球首个AI海洋大模型“瞰海”,可精准预测10天内海洋变化;宇树科技“Embodied Avatar”系统实现低延迟远程机器人操控;谷歌Gemini API推出文件搜索工具,简化私有RAG系统集成。

  • AI日报:昆仑万维SkyReels V3模型上线;月之暗面推Kimi Linear模型;MiniMax Music 2.0 发布

    本期AI日报聚焦多领域创新:昆仑万维推出SkyReels V3模型,整合顶尖视频生成能力;月之暗面Kimi Linear模型处理长文本速度提升2.9倍;MiniMax Music 2.0实现专业级音乐创作;字节跳动启动豆包股权激励计划吸引AI人才;苹果iOS 27将迎AI重大升级,Siri更个性化;Dia浏览器融合Arc设计理念与AI技术;文心魔法漫画工具实现一键生成连载作品;谷歌Gemini Canvas新增PPT自动生成功能,由Gemini 2.5 Pro驱动,提升职场效率。

  • 百度智能云这项开源,让 DeepSeek-V3.2 推理服务吞吐提升 2 倍

    10月28日,百度智能云联合SGLang社区开源针对DeepSeek-V3.2优化的多token预测(MTP)技术代码。该技术通过批量生成和集中验证机制,使模型解码吞吐量提升超2倍,突破传统自回归解码的序列化瓶颈。此次开源的MTP方案已完成与DeepSeek-V3.2稀疏注意力架构的深度适配,并经过百度内部业务验证,开发者可"开箱即用"获得稳定可靠的推理加速能力。

  • 操作系统大会2025 | 麒麟信安系列新品发布!智创未来,再启新程

    11月14日,以“智跃无界,开源致远”为主题的操作系统大会2025在北京成功举办。大会由OpenAtom openEuler主办,麒麟信安作为联合主办方,重磅发布操作系统V6、智能机器人系统V1.0及新一代智能云等新品。V6基于Linux 6.6内核与openEuler 24.03构建,覆盖全场景应用,安全能力显著提升,通过权威认证。智能机器人系统以V6为底座,集成AI与安全能力,支持统一管理。麒麟信安产品已广泛应用于电力、政务、金融等领域,为行业数字化提供坚实底座,致力于推动智能操作系统的创新发展。

  • 无万卡,不VLA:元戎启行与阿里云的“想法”和“解法”

    1980年代汉斯·莫拉维克提出人工智能悖论:计算机在逻辑推理等高级智能活动中易超越人类,但实现儿童般的感知与常识认知却极困难。智能驾驶的核心挑战在于让AI理解物理世界并进行因果推理。视觉-语言-行动模型通过融合多模态数据,使系统具备推理驾驶能力,推动行业迈向L5完全自动驾驶。面对VLA模型的数据处理、训练效率和成本挑战,阿里云等超级AI云提供全栈解决方案,从算力基础设施到开源生态,加速技术迭代与商业化落地。

  • 小米超级小爱AI大模型推出随心修图功能

    小米宣布超级小爱AI大模型推出随心修图功能,用户只需一句话即可轻松修出具有大片质感的照片。该功能有两种使用方式:在相册大图页面直接唤醒AI或通过应用上传照片并输入指令。使用需满足版本要求:超级小爱需v7.8.50及以上,相册编辑功能需v2.1及以上,相册本身需v4.3.0.30及以上。目前仅限Xiaomi HyperAI机型支持在相册大图页使用。超级小爱于2024年12月面向正式版用户开放升级,支持全局多模态交互和自然语音搜索,提升使用体验。

今日大家都在搜的词: