Stability AI推出视频生成模型Stable Video Diffusion

2023-11-22 09:35 · 稿源：站长之家

**划重点:**
1. 🎥 Stability AI发布开源的视频生成模型Stable Video Diffusion，基于其现有的Stable Diffusion文本转图像模型，可通过动画化现有图像生成视频。
2. ⚠️ 模型目前处于“研究预览”阶段，使用者需同意特定使用条款，限制其应用于“教育或创意工具”等领域，禁止用于“真实事件或人物的表现”。
3. 💰 Stability AI计划商业化应用，已筹集超过1.25亿美元资金，但面临财务困境和高烧钱速度。公司前高管离职，曾提出更严格的版权使用方针。

站长之家（ChinaZ.com）11月22日消息:Stability AI近日推出了名为Stable Video Diffusion的视频生成模型，该模型基于该公司现有的Stable Diffusion文本转图像模型，能够通过对现有图像进行动画化生成视频。与其他AI公司不同，Stable Video Diffusion在开源领域提供了少数几个视频生成模型之一。

然而，需要注意的是，该模型目前处于“研究预览”阶段，使用者必须同意特定的使用条款，明确规定了其预期应用领域，如“教育或创意工具”等，同时禁止用于“真实事件或人物的表现”。考虑到过去类似AI研究预览的历史，有可能该模型很快会在暗网上流传，引发对其滥用的担忧，特别是因为它似乎没有内置的内容过滤器。

Stable Video Diffusion提供两个模型，分别为SVD和SVD-XT。其中，SVD将静止图像转换为14帧的576x1024视频，而SVD-XT在相同的架构下将帧数提升至24。这两者都能以每秒3到30帧的速度生成视频。白皮书显示，这两个模型最初在数百万个视频的数据集上进行训练，然后在数十万到百万数量级的较小数据集上进行“微调”。

模型生成的四秒视频片段质量相当高，被认为在某些方面可以与Meta、Google以及其他AI初创公司的视频生成模型相媲美。然而，Stable Video Diffusion存在一些局限性，例如不能生成没有运动或慢速摄像机移动的视频，无法通过文本控制，不能呈现文本（至少不能清晰可辨认），也不能一致地生成面部和人物。

尽管存在这些局限性，Stability AI指出这些模型是相当可扩展的，并可适应生成物体的360度视图等用例。公司计划推出“一系列”建立在SVD和SVD-XT基础上并扩展其功能的模型，以及一款将文本提示引入网络模型的“文本到视频”工具。最终目标是商业化，认为Stable Video Diffusion在“广告、教育、娱乐等领域都具有潜在应用”。

然而，Stability AI目前面临财务问题。据报道，公司最近通过可转债筹集了2500万美元，使其总融资达到1.25亿美元。但是，公司并未以更高的估值完成新一轮融资，最后一次估值为10亿美元。Stability AI曾计划在未来几个月内寻求四倍于此的估值，尽管公司收入较低，烧钱速度较高。

在这一时期，Stability AI还面临一次高管离职。公司副总裁Ed Newton-Rex在一份公开信中表示，他因对如何使用版权数据进行争论而离开了公司。这也是公司面临的另一次挫折，因为Newton-Rex曾在稳定AI音乐生成工具Stable Audio的推出中扮演了关键角色。

官方演示视频： https://www.youtube.com/watch?v=G7mihAy691g

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
Stability AI发布Stable LM2模型更新，参数增至120亿

站长之家（ChinaZ.com）4月9日消息:Stability AI在最新的Stable LM2模型更新中，宣布将参数增至120亿，以提升性能与可访问性。该更新为用户提供了更强大、更精确的文本内容生成能力。Stability AI指出，该模型在特定基准测试下表现优异，超过了Llama270B等更大型模型。新的Stable LM212B模型包括基础版本和经过指导调整的变体，旨在增强七种语言（英语、西班牙语、德语、意大利语、法�

StabilityAI StableLM2 AI头条
Stability AI发布音频模型 Stable Audio2.0:支持生成多种类型音乐时长达3分钟

著名开源大模型平台Stability.ai在官网正式发布了音频模型StableAudio2.0。这一版本支持用户通过文本或音频生成多种类型的高质量音乐，时长可达3分钟44.1kHz。随着Stability.ai不断推出新功能和技术，用户可以期待更多高质量、多样化的音乐生成体验。

StableAudio StableAudio2.0 AI头条
突发！Stable Diffusion 3，可通过API使用啦

4月18日，著名开源大模型平台Stability.ai在官网宣布，最新文生图模型StableDiffusion3和SD3Turbo可以在API中使用。本次继续由知名API管理平台FireworksAI提供服务。在山顶上有一位巫师创作了一幅令人惊叹的艺术作品，他用魔法创造了文字"StableDiffusion3API"。

StableDiffusion3 API AI头条
荐模型未发API先至！Stable Diffusion 3 API 发布性能比肩 Midjourney v6

其开发者平台API现已支持最新版本的StableDiffusion3及其增强版本StableDiffusion3Turbo。这一发布标志着StabilityAI在文字到图像生成领域的技术进步，其性能已经达到甚至超越了行业内的一些领先模型，如DALL-E3和Midjourneyv6。公司承诺提供99.9%的服务可用性，这对于企业用户来说尤为重要，因为他们在使用开发者平台进行关键的生成型AI工作时，需要确保服务的稳定性和可靠性。

StableDiffusion3
Stability AI发布CosXL模型图像处理能力更精细

StabilityAI最近推出了CosXL模型，这是一项包括基础版CoXL和增强版EditCosXL的创新技术。这些模型的发布，标志着图像生成和编辑技术的新里程碑，为用户提供了更加强大和精细的图像处理能力。特别是ComfyUI，它还为用户提供了详细的工作流程和指导，帮助用户更加高效和便捷地使用CosXL模型。

CosXL AI头条
据称Stability AI资金告急，无法支付租用的云GPU账单

生成式AI明星StabilityAI的热门文本到图像生成模型StableDiffusion所需的大规模GPU集群似乎也部分导致了前首席执行官EmadMostaque的失败-因为他找不到支付这些GPU的方法。根据引用公司文件和数十位知情人士的详尽报道，据称这家英国模型构建公司的极高基础设施成本耗尽了公司的现金储备，导致截至去年十月时，公司只剩下400万美元。计划将其在CoreWeave的GPU容量转售给风险投资公司

StabilityAI AI头条
Stable Diffusion 3 API申请入口 AI文生图API官方免费申请地址

StableDiffusion3API是一款先进的文本到图像生成系统，它在排版和提示遵循方面与DALL-E3和Midjourneyv6等顶尖系统相匹敌或更优。该系统采用新的多模态扩散变换器架构，使用不同的权重集来改善图像和语言的表示，从提高文本理解和拼写能力。StableDiffusion3API的使用场景示例在以下情况下，您可以使用StableDiffusion3API进行图像生成：生成广告宣传图创建游戏角色概念图辅助教学材料的图像制作产品特色和功能StableDiffusion3API具有以下特色和功能：文本到图像的生成多模态扩散变换器架构图像和语言的独立表示文本理解和拼写能力提升想要了解更多关于StableDiffusion3API的信息并开始您的图像生成之旅，请访问StableDiffusion3API官方网站。

StableDiffusion3API
Stability AI宣布裁员20人，约占员工总数的10%

英国AI公司StabilityAI宣布裁员20人，占其员工总数的约10%。该公司刚刚宣布扩大其旗舰模型的使用范围。这起案件将很快在英国进行审理。

StabilityAI AI头条
Midjourney指控Stability AI员工入侵其数据库并窃取图像

据AI爱好者NickSt.Pierre最近在X上分享的消息，周六发生了一起被指称为侵犯知识产权的事件。StabilityAI的员工入侵了Midjourney的数据库，窃取了所有的提示和图像对，这一行为还导致了长达24小时的服务中断。在这场AI公司之间的冲突中，让我们拭目以待进展，看看这一事件是否会对这两家公司之间的关系产生持久影响。

Midjourney StabilityAI AI头条
AI视频生成工具ID-Animator：可保持角色一致生成视频动画

生成具有指定身份的高保真人类视频引起了广泛关注。现有技术在训练效率和身份保持之间往往难以取得平衡，要么需要繁琐的逐案微调，要么在视频生成过程中通常会丢失身份细节。当提供多个控制图像时，生成的视频序列紧密遵循多个图像提供的序列。

ID-Animator AI头条

今日大家都在搜的词：

热文

3 天
7天

Stability AI推出视频生成模型Stable Video Diffusion

今日大家都在搜的词：

热文

站长商机