首页 > AI头条  > 正文

阿里通义发布 Wan2.2-I2V-Flash 图生视频模型 推理速度大幅提升

2025-08-11 16:06 · 来源: AIbase基地

阿里通义大模型今日宣布推出其最新图生视频模型Wan2.2-12V-Flash,该模型的上线将为用户带来更快速、更专业、更稳定的视频生成体验。

Wan2.2-12V-Flash在保持电影级视觉呈现的同时,实现了生成速度与性价比的全面提升。此次发布的Wan2.2-12V-Flash模型在推理速度上相比前代Wan2.1提升了12倍,显著提高了创作效率。新模型的指令遵循能力也得到了大幅提升,能够直接响应各种特效提示词,实现运镜的精准控制,确保指令的准确执行。

微信截图_20250811160558.png

此外,Wan2.2-12V-Flash能够稳定输出风格化的图像,并为这些图像添加合理自然的动态效果,无论输入的是哪种风格化图像,都能保持其独特风格。

Wan2.2-12V-Flash的发布,不仅在功能上进行了升级,还在速度、成本、稳定性和表现力上展现了其优势。新模型的价格低至0.1元/秒,抽卡成功率相比Wan2.1提升了123%,为用户提供了更具性价比的选择。

阿里云百炼平台现已开放Wan2.2-12V-Flash模型的API调用,用户可以登录阿里云百炼平台体验这一全新模型的强大功能。随着Wan2.2-12V-Flash的推出,视频内容创作者将能够以更低的成本和更高的效率创作出高质量的视频内容,进一步推动数字媒体和娱乐行业的发展。

  • 相关推荐
  • AI日报:智谱AI重磅发布GLM-4.5;阿里开源Wan2.2;阶跃星辰推全新模型Step3

    【AI日报】本期重点内容:1.智谱AI发布开源大模型GLM-4.5,在推理、编码和智能体能力方面达到SOTA水平;2.阿里开源视频生成模型Wan2.2,采用MoE架构提升计算效率;3.阶跃星辰推出AI研究助手"阶跃深研",支持金融医疗等专业领域研究;4.微软Edge浏览器新增Copilot模式,提供智能搜索体验;5.Anthropic对Claude用户实施使用限制引发争议;6.阶跃星辰发布321B参数大模型Step3;7.蚂�

  • AI大模型选型决策指南:10分钟数据对比 Gemini 2.5 Flash-Lite 与 DeepSeek R1

    本文探讨大模型选型困境与解决方案。2025年全球可调用大模型超300个,但选型面临三大难题:单位混乱、定价波动快、87%团队无法量化模型价值。提出三层漏斗筛选法:1)场景刚需筛选80%选项;2)验证核心性能;3)评估边际效益。以Gemini和DeepSeek为例,前者适合常规FAQ场景年省$16,000,后者适用于金融计算场景可降低15%人工复核。建议建立动态评估体系,将3小时选型会议压缩至18分钟,错误率下降40%。核心观点:选型应从参数争论转向场景验证,通过自动化工具为工程师节省时间,聚焦提示词优化而非参数对比。

  • 乘势焕新|V6家居2025秋季新品发布会暨经销商大会启幕全民焕新家时代

    V6家居举办2025秋季新品发布会,推出沙发、床垫等系列新品,主打"高颜值、高品质、高舒适度"设计理念。同时携手央视网启动国家级IP项目《全民焕新家》,通过"一站购新家"模式降低消费门槛。活动汇聚慕思集团高层及行业专家,探讨大家居行业趋势。品牌强调"自主研产销"一体化优势,并推出"空-炮-巷"三位一体营销模型,构建精准零售体系。现场多位经销商分享实战经验,展示终端创新案例。V6家居总经理江涛表示,将持续深化产品力与服务力,携手合作伙伴共同推动国民家居品质升级。

  • AI日报:B站测试AI视频工具花生AI;腾讯发布多模态模型Large-Vision;昆仑万维开源Skywork UniPic 2.0

    【AI日报】主要内容: 1. B站测试"花生AI"视频工具,3分钟可成片,同时推进自研大模型和多语言翻译功能 2. 昆仑万维开源多模态模型Skywork UniPic 2.0,实现高效统一的多模态生成能力 3. 马斯克指责苹果偏袒OpenAI,苹果回应称平台设计公平公正 4. 腾讯混元发布52B参数多模态理解模型Large-Vision,支持任意分辨率输入 5. DeepSeek官方否认8月发布R2模型的传闻 6. OpenAI推出超值ChatGPT Go套餐,仅399卢比降低使用门槛 7. AI新贵Perplexity豪掷345亿美元收购谷歌Chrome 8. Anthropic的Claude Sonnet 4模型支持100万token上下文 9. ChatGPT重大更新:恢复GPT-4o默认模式,为GPT-5引入多模式选择,优化交互体验

  • AI日报:腾讯推音效生成工具AudioGenie;阿里推智能体WebWatcher;我国首个法律垂直大模型“小包公”发布

    本文介绍了AI领域最新动态:1)腾讯推出电影级音频生成工具AudioGenie,展现中国AI技术实力;2)阿里开源多模态智能体WebWatcher,突破现有系统局限;3)港大等高校联合推出3D建模技术OmniPart,实现模型组件独立性和清晰度;4)Meta发布无需标注数据的通用图像处理模型DINOv3;5)国内首个法律大模型"小包公"发布;6)ChatGPT移动端收入突破20亿美元;7)安卓厂商借鉴灵动岛设计,新芯片推动AI功能普及;8)欧洲AI公司推出仅94MB的超小模型;9)Claude Code新增编程教学模式;10)AI技术被滥用于电商恶意退款;11)IDC报告显示2024年中国AI公有云服务市场将快速增长。

  • AI 大模型选型指导:一文实测 Kimi‑K2‑Turbo‑Preview 与 Qwen3‑Coder‑Flash

    本文对比分析了Kimi-K2-Turbo-Preview和Qwen3-Coder-Flash两款AI大模型在开发者选型中的表现。K2-Turbo采用MoE架构,激活参数32B,支持128K上下文,在代码调试和自动化流程方面表现突出;Qwen3-Coder为480B参数的MoE模型,原生支持256K上下文,擅长大规模代码库理解和API集成。二者在中级任务表现接近,但K2在复杂可视化任务更优,Qwen3在多轮Agent调用更稳定。建议根据需求选择:注重调试自动化选K2,需要长上下文支持选Qwen3。推荐使用AIbase模型广场进行高效选型对比。

  • 2025WAIC 聚焦:扫描全能王“无限扫描”技术破解文保数字化难题

    2025世界人工智能大会上,合众信息旗下扫描全能王展示了"无限扫描"技术,为文物数字化带来突破。该技术成功应用于南京博物院镇馆之宝《坤舆万国全图》的数字化,这幅1608年的地图是国内现存最早、最完整的中文世界地图。通过AI技术,解决了大尺寸文物拍摄不全、拼接困难、图像畸变等难题,只需简单拍摄视频即可生成高清数字图像。AI还能智能识别地图元素,实现"让文物说话"的数字化体验。该技术也适用于工程设计图纸等大尺寸文档的数字化保存,突破物理条件限制,为文化传承开启新篇章。(140字)

  • 当“附近生活”逐渐消失时,高德地图2025要重构“附近5公里”

    ​著名社会人类学教授项飙曾经提出一个发人深省的概念——"附近消失"。他认为,在全球化和数字化的浪潮中,我们与身边500米范围内真实生活空间的联系正在逐渐断裂。 "附近消失"的含义是说,在数字化的高速车道上,我们习惯了指尖触达世界,却渐渐忘记脚下的距离。十年前,人们习惯走出家门与便利店老板打个招呼,早晨的早餐摊会有常客的问候,甚�

  • AI日报:阿里新发布Qwen3-4B模型;小红书发布开源模型dots.vlm1;MiniMax Speech 2.5语音生成模型上线

    AI日报栏目聚焦人工智能领域最新动态:1)阿里发布Qwen3-4B轻量级模型,手机端可运行;2)小红书开源多模态大模型dots.vlm1,在图表推理方面表现突出;3)MiniMax推出语音生成模型Speech2.5,多语种表现提升;4)Midjourney推出HD视频模式,提升专业影像质量;5)Cursor1.4版本增强异步任务处理能力;6)谷歌否认AI搜索影响网站流量,但数据显示用户行为改变;7)MiniCPM-V4.0开源发布,号称"手机上的GPT-4V";8)AMD与高通宣布支持OpenAI的gpt-oss系列模型;9)腾讯开源WeKnora文档智能解析工具;11)疑似GPT-5信息在GitHub泄露;12)FlowSpeech实现书面语转口语的TTS技术突破。

  • AI日报:阿里推全新图片模型Qwen-Image;小米全量开源MiDashengLM-7B;智谱Zread.ai搭载 GLM-4.5

    本文汇总了AI领域最新动态:1)阿里开源文生图模型Qwen-Image,中文文本渲染领先;2)ChatGPT周活用户达7亿,OpenAI年收入120亿美元;3)Anthropic测试Claude Opus 4.1,推理能力升级;4)智谱推出开发工具Zread.ai提升代码理解效率;5)xAI发布Grok Imagine4支持文生视频及NSFW内容;6)Character.AI推出首个AI原生社交功能;7)阿里与南开合作视频压缩技术LLaVA-Scissor;8)北京团队突破人形机器人3D视觉系统�

今日大家都在搜的词: