阿里通义万相首尾帧生视频模型Wan2.1-FLF2V-14B开源

2025-04-18 10:52 · 来源： AIbase基地

阿里巴巴旗下的通义实验室在Hugging Face和GitHub平台正式开源了其最新的Wan2.1-FLF2V-14B首尾帧生视频模型。这一模型以其支持高清视频生成和灵活的首尾帧控制功能引发业界热议，为AI驱动的视频创作提供了全新可能。

Wan2.1-FLF2V-14B:首尾帧驱动的视频生成新标杆

Wan2.1-FLF2V-14B是阿里通义万相系列的最新力作，基于数据驱动训练和**DiT（Diffusion Transformer）**架构，专为首尾帧视频生成设计。据社交媒体平台上的讨论，该模型只需用户提供两张图片作为首帧和尾帧，即可生成一段长约5秒、720p分辨率的高清视频，运动流畅且首尾过渡自然。

AIbase了解到，该模型不仅支持文本到视频和图像到视频，还具备视频编辑、文本到图像以及视频到音频的扩展功能。其核心优势在于对动态场景的精准建模，能够在生成过程中有效捕捉首尾帧之间的运动轨迹和视觉细节，为用户提供高质量的视频内容。

核心特性:高效、灵活、多场景

Wan2.1-FLF2V-14B的发布为视频生成领域带来了多项突破性功能，AIbase总结其亮点如下:

首尾帧控制:用户可通过两张图片定义视频的起点和终点，模型自动生成中间过渡内容，适合短视频创作和动画预览。

高清输出:支持720p分辨率，生成时长约5秒，平均耗时8分钟，满足快速内容产出的需求。

多模态支持:除首尾帧视频生成外，模型还支持文本引导的图像生成和音频生成，拓展了创作场景。

开源生态:模型已在GitHub和Hugging Face开放源代码，附带详细文档，方便开发者进行本地部署和二次开发。

AIbase认为，Wan2.1-FLF2V-14B的开源特性显著降低了视频生成技术的使用门槛，为独立开发者、内容创作者和企业提供了探索AI视频生成的机会。

社区反响:开源生态的强力推动

自Wan2.1-FLF2V-14B发布以来，社交媒体平台上的讨论热度持续攀升。AI社区对模型的流畅运动表现和开源举措给予高度评价，认为其填补了本地视频生成模型的空白。AIbase注意到，许多开发者呼吁尽快推出量化版本，以降低计算资源需求，进一步提升模型的普及度。

与此同时，阿里通义实验室还推出了免费体验活动，用户可通过签到和创作任务获取积分，用于模型的试用。这一举措进一步激发了社区的参与热情，为模型的迭代优化提供了宝贵反馈。

行业影响:重塑视频创作与应用场景

Wan2.1-FLF2V-14B的开源标志着阿里在AI视频生成领域的战略布局迈出了重要一步。AIbase预测，该模型将在以下领域展现巨大潜力:

内容创作:短视频平台创作者可利用首尾帧功能快速生成过渡动画或特效片段。

影视制作:电影和动画预览团队可通过模型测试场景过渡，降低前期制作成本。

教育与营销:企业可生成定制化的宣传视频或教学内容，提升视觉吸引力。

然而，AIbase也提醒，视频生成技术的普及需关注版权和伦理问题。阿里未来可能需要加强模型输出内容的监管机制，以防止潜在的滥用风险。

阿里通义万相Wan2.1-FLF2V-14B的开源发布，不仅展示了阿里在AI视频生成领域的技术实力，也为全球开发者提供了探索视频创作新可能的平台。作为AIbase，我们期待这一模型在开源社区的推动下，加速AI技术在内容创作和商业应用中的普及。欲了解更多技术细节或体验模型，请访问阿里通义实验室的GitHub仓库或Hugging Face平台。

github:https://github.com/Wan-Video/Wan2.1
huggingface:https://huggingface.co/Wan-AI/Wan2.1-FLF2V-14B-720P
魔搭社区:https://www.modelscope.cn/models/Wan-AI/Wan2.1-FLF2V-14B-720P
直接体验入口:https://tongyi.aliyun.com/wanxiang/videoCreation

相关推荐

荐AI日报：阿里通义万相首尾帧生视频模型；豆包开源Seed智能体模型UI-TARS-1.5；OpenAI首发“智能体实践指南”

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里通义万相首尾帧生视频模型Wan2.1-FLF2V-14B开源阿里巴巴的通义实验室在Hugging Face和GitHub上开源了Wan2.1-FLF2V-14B模型，标志着AI视频生成技术的重大进步。该模型支持高清视频生成

AI视频生成开源模型阿里巴巴
荐马斯克炫酷变身毒液！实测通义Wan2.1首尾帧视频模型，还能“拼接”经典梗图

在GitHub狂揽1w+星标的通义万相Wan2.1，又双叒上新了!最新打开方式是酱婶儿的:给出开始（首帧）和结束(尾帧)两张图片，Wan2.1便能分分钟生成一段丝滑的5s、720p视频。根据前后视角的不同，还能自动调整镜头角度，缓慢变成高空俯拍，并同时保证人物光影正确:原来这是阿里通义万相Wan2.1最新开源的首尾帧视频模型，基于Wan2.1文生视频14B大模型，为创作者们提供更高效、更灵活的

视频生成开源模型阿里通义万相
阿里开源通义新模型：指定首尾图片生成视频

快科技4月18日消息，据报道，阿里巴巴旗下通义万相宣布开源其创新视频生成技术首尾帧生视频14B模型。这项突破性AI技术能够根据用户提供的起始和结束画面，智能生成720p高清过渡视频，为视频创作带来全新可能。该模型通过先进的深度学习算法，能够精准理解输入画面的内容、风格及主题特征。当用户提供首尾两帧图像后，模型会智能分析画面中的视觉元素，包括物体形�

阿里巴巴通义万相视频生成技术
上线仅7天！阿里通义千问3强势登顶全球开源模型宝座

据了解，千问3是国内首个混合推理模型”，快思考”与慢思考”集成进同一个模型，对简单需求可低算力秒回”答案，对复杂问题可多步骤深度思考”，大大节省算力消耗。

通义千问开源模型大模型测评
荐AI日报：阿里通义千问Qwen3问鼎全球开源模型；Kimi长思考模型API发布；OpenAI发布新一代GPT-4.1模型

【AI日报】汇总了近期AI领域重要动态：1)阿里通义千问3开源模型上线7天即登顶全球开源模型榜首，在指令遵循和推理能力上超越闭源模型；2)月之暗面推出Kimi长思考模型API，可解决复杂代码和数学问题；3)OpenAI发布GPT-4.1模型，性能提升显著；4)Google推出Gemini2.5Pro模型，提升开发者编码能力；5)联想发布"天禧超级智能体"，具备多模态感知能力；6)腾讯元宝上线"对话分

AI日报通义千问3 开源模型
GPTBots 集成阿里通义千问 3.0，持续为企业提供顶尖 AI 服务

GPTBots.ai平台宣布完成与阿里通义千问3.0系列模型的技术集成，成为企业级AI智能体构建领域的标杆平台。该平台通过混合推理架构和多语言交互技术，支持119种语言服务，覆盖全球主要市场。平台提供双模式智能任务处理：针对复杂业务场景的"深度思考"模式，以及高频咨询的"即时响应"模式。搭载Qwen-3-235B旗舰模型和Qwen-3-30B轻量版，在代码生成、数学推理等核心能力上达到行业顶尖水平。平台实现与企业ERP、CRM等系统的无缝对接，推动数据价值变现。通过标准化流程自动化、全球化服务等核心价值，帮助企业提升运营效率70%、降低客服成本70%，并实现数据驱动的决策升级。

GPTBots 阿里通义千问 AI服务
阿里千问3登顶全球最强开源模型已在通义App上线

阿里集团推出新一代开源AI模型"通义千问3"(Qwen3)，包含8款不同规格的混合推理模型。旗舰型号Qwen3-235B采用混合专家架构，创下国产模型性能新纪录；Qwen3-32B则以部署成本低、运行稳定见长。该系列在逻辑推理、编程、翻译等专业领域表现卓越，用户可通过通义App和网页版体验。升级后的通义App整合问答对话、图像理解与生成等多项功能，持续强化代码生成、数学解题等专业场景应用能力，致力于打造实用性强的个人AI助手。
荐AI日报：智谱开源32B/9B系列GLM模型并启用Z.ai域名；OpenAI发布GPT-4.1系列模型；阿里魔搭上线MCP广场

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、智谱AI启用全新域名Z.ai 并开源32B/9B 系列 GLM 模型智谱技术团队近期宣布开源32B和9B系列的GLM模型，并推出全新交互体验平台Z.ai。这些模型遵循MIT许可协议，支持商业用途，提升了

人工智能开源模型 GLM模型
DeepSeek上新！开源发布DeepSeek-Prover-V2-671B新模型

快科技4月30日消息，今日，DeepSeek 今日在 AI 开源社区 Hugging Face 发布了一个名为 DeepSeek-Prover-V2-671B 的新模型。据介绍，DeepSeek-Prover-V2-671B 其参数量达到6710亿，使用了更高效的 safetensors 文件格式，并支持 BF16、FP8、F32 等多种计算精度，方便模型更快、更省资源地训练和部署。在模型架构上，该模型使用了DeepSeek-V3架构，采用MoE（混合专家）模式，具有61层Transformer层，7168维隐藏层。同时支持超长上下文，最大位置嵌入达163840，使其能处理复杂的数学证明，并且采用了FP8量化，可通过量化技术减小模型大小，提

DeepSeek AI模型发布开源社区
荐AI日报：扣子空间开放测试；腾讯混元开源视频生成工具HunyuanCustom；阿里开源大模型搜索引擎ZeroSearch

本文汇总了近期AI领域多项重要进展：1)扣子空间开放测试，无需邀请码即可体验AI协作平台；2)腾讯推出HunyuanCustom视频生成工具，实现音视频同步编辑；3)阿里巴巴ZeroSearch技术降低AI训练成本88%；4)OpenAI新增GitHub连接器，强化代码分析功能；5)联想发布天禧个人超级智能体，具备感知交互能力；6)OpenAI在亚洲推出数据驻留计划；7)Multiverse发布全球首款AI生成多人游戏；8)秘塔AI上线"讲题"功能辅助家长辅导；9)Genspark推出智能电子表格工具AI Sheets；10)Google Gemini API新增缓存功能可节省75%成本；11)PixVerse v4视频生成速度质量双提升；12)快手推出内容净化器KuaiMod；13)英伟达开源新一代OCR代码推理模型。这些创新覆盖AI应用、开发工具、成本优化等多个维度，展现了AI技术的快速发展和广泛应用。

AI产品人工智能技术趋势

今日大家都在搜的词：

热文

3 天
7天

阿里通义万相首尾帧生视频模型Wan2.1-FLF2V-14B开源

荐AI日报：阿里通义万相首尾帧生视频模型；豆包开源Seed智能体模型UI-TARS-1.5；OpenAI首发“智能体实践指南”

荐马斯克炫酷变身毒液！实测通义Wan2.1首尾帧视频模型，还能“拼接”经典梗图

阿里开源通义新模型：指定首尾图片生成视频

上线仅7天！阿里通义千问3强势登顶全球开源模型宝座

荐AI日报：阿里通义千问Qwen3问鼎全球开源模型；Kimi长思考模型API发布；OpenAI发布新一代GPT-4.1模型

GPTBots 集成阿里通义千问 3.0，持续为企业提供顶尖 AI 服务

阿里千问3登顶全球最强开源模型已在通义App上线

荐AI日报：智谱开源32B/9B系列GLM模型并启用Z.ai域名；OpenAI发布GPT-4.1系列模型；阿里魔搭上线MCP广场

DeepSeek上新！开源发布DeepSeek-Prover-V2-671B新模型

荐AI日报：扣子空间开放测试；腾讯混元开源视频生成工具HunyuanCustom；阿里开源大模型搜索引擎ZeroSearch

今日大家都在搜的词：

热文

特朗普准备撤回“AI芯片出口管制”……各国单独谈判

Anthropic推出Claude网络搜索API，押注“后谷歌时代”信息访问

隐私被抛弃，监控成为主流？Meta为其AI眼镜新增人脸识别功能

苹果高管称：10 年后，可能 iPhone 将不复存在！

特朗普关税政策颠覆汽车行业，福特率先开启“涨价潮”！

基于安卓16的三星 One UI 8 本月发布首个测试版本

每年多付1230亿美元？特朗普关税或将“掏空”美国人的钱包

苹果“为彼此创造”不再？听乔纳森·艾维忆往昔、谈传承

三星推出新型微显示技术，加剧 AR 眼镜竞争

全网最大的“AI色情网站”MrDeepfakes宣布永久关闭

马斯克称地球会被太阳焚化，网友：有科学依据，但…

特朗普准备撤回“AI芯片出口管制”……各国单独谈判

20周年纪念版iPhone迎来重大变革，全屏设计+屏下摄像头

隐私被抛弃，监控成为主流？Meta为其AI眼镜新增人脸识别功能

Anthropic推出Claude网络搜索API，押注“后谷歌时代”信息访问

2025 年，SpaceX 发射了多少枚火箭？

苹果高管称：10 年后，可能 iPhone 将不复存在！

谷歌在Pixel 9 Pro广告中，嘲讽iPhone 17：抄袭、老旧！

不顾特朗普的阻挠，Uber继续全球扩张…携手土耳其及中国企

站长商机

​阿里通义万相首尾帧生视频模型Wan2.1-FLF2V-14B开源

今日大家都在搜的词：

热文

站长商机

阿里通义万相首尾帧生视频模型Wan2.1-FLF2V-14B开源