首页 > 业界 > 关键词  > StabilityAI最新资讯  > 正文

Stability AI推出视频生成模型Stable Video Diffusion

2023-11-22 09:35 · 稿源:站长之家

**划重点:**

1. 🎥 Stability AI发布开源的视频生成模型Stable Video Diffusion,基于其现有的Stable Diffusion文本转图像模型,可通过动画化现有图像生成视频。

2. ⚠️ 模型目前处于“研究预览”阶段,使用者需同意特定使用条款,限制其应用于“教育或创意工具”等领域,禁止用于“真实事件或人物的表现”。

3. 💰 Stability AI计划商业化应用,已筹集超过1.25亿美元资金,但面临财务困境和高烧钱速度。公司前高管离职,曾提出更严格的版权使用方针。

站长之家(ChinaZ.com)11月22日 消息:Stability AI近日推出了名为Stable Video Diffusion的视频生成模型,该模型基于该公司现有的Stable Diffusion文本转图像模型,能够通过对现有图像进行动画化生成视频。与其他AI公司不同,Stable Video Diffusion在开源领域提供了少数几个视频生成模型之一。

image.png

然而,需要注意的是,该模型目前处于“研究预览”阶段,使用者必须同意特定的使用条款,明确规定了其预期应用领域,如“教育或创意工具”等,同时禁止用于“真实事件或人物的表现”。考虑到过去类似AI研究预览的历史,有可能该模型很快会在暗网上流传,引发对其滥用的担忧,特别是因为它似乎没有内置的内容过滤器。

Stable Video Diffusion提供两个模型,分别为SVD和SVD-XT。其中,SVD将静止图像转换为14帧的576x1024视频,而SVD-XT在相同的架构下将帧数提升至24。这两者都能以每秒3到30帧的速度生成视频。白皮书显示,这两个模型最初在数百万个视频的数据集上进行训练,然后在数十万到百万数量级的较小数据集上进行“微调”。

模型生成的四秒视频片段质量相当高,被认为在某些方面可以与Meta、Google以及其他AI初创公司的视频生成模型相媲美。然而,Stable Video Diffusion存在一些局限性,例如不能生成没有运动或慢速摄像机移动的视频,无法通过文本控制,不能呈现文本(至少不能清晰可辨认),也不能一致地生成面部和人物。

尽管存在这些局限性,Stability AI指出这些模型是相当可扩展的,并可适应生成物体的360度视图等用例。公司计划推出“一系列”建立在SVD和SVD-XT基础上并扩展其功能的模型,以及一款将文本提示引入网络模型的“文本到视频”工具。最终目标是商业化,认为Stable Video Diffusion在“广告、教育、娱乐等领域都具有潜在应用”。

然而,Stability AI目前面临财务问题。据报道,公司最近通过可转债筹集了2500万美元,使其总融资达到1.25亿美元。但是,公司并未以更高的估值完成新一轮融资,最后一次估值为10亿美元。Stability AI曾计划在未来几个月内寻求四倍于此的估值,尽管公司收入较低,烧钱速度较高。

在这一时期,Stability AI还面临一次高管离职。公司副总裁Ed Newton-Rex在一份公开信中表示,他因对如何使用版权数据进行争论而离开了公司。这也是公司面临的另一次挫折,因为Newton-Rex曾在稳定AI音乐生成工具Stable Audio的推出中扮演了关键角色。

官方演示视频: https://www.youtube.com/watch?v=G7mihAy691g

举报

  • 相关推荐
  • 腾讯云TencentOS提交Swap Table补丁系列 Linux内核内存交换性能提升20%~30%

    腾讯云操作系统团队提交了名为Swap Table的补丁系列,针对Linux内核交换子系统进行优化。该系列在4K页面和mTHP folios场景下,使系统性能提升20%-30%。Swap Table通过智能调度机制优化数据定位,支持大页尺寸减少操作次数,并实现动态空间扩展。27项独立改进解决了历史遗留问题,经实测性能显著提升。目前补丁系列正处于审核阶段,有望纳入Linux内核主线。这是腾讯云团队继内存控制组、页面热管理等创新后,在操作系统核心技术领域的又一突破,将强化TencentOS Server的高性能优势。

  • 淘宝天下入选《TopDigital2025全球AI营销图谱》

    7月29日,淘宝天下凭借AI服务平台"淘宝AI智+"的创新实践,成功入选《TopDigital2025全球AI营销图谱》"智能分析与决策"赛道。该平台整合淘宝生态数据资源,构建覆盖数据分析、智能营销、内容生成等全链路的AI解决方案体系,通过模块化设计降低使用门槛,帮助商家实现降本增效。平台还提供深度定制开发服务,推动AI能力与业务场景有机融合。此次入选标志着淘宝天下在AI技术创新与商业应用方面的成果获得行业认可。团队表示将持续聚焦AI技术实用价值转化,拓展电商营销领域的创新应用场景。

  • 苹果iOS 26 Beta 5上线:细节优化 更新内容一览

    控制中心成为此次更新的重点优化区域。页面滑动切换时新增的弹性动画使操作更具连贯性,Wi-Fi模块长按后首次显示网络属性标识——私有网络标注“家庭/办公”字样,公共网络则提示“需谨慎连接”,密码保护状态通过锁形图标直观呈现。灵动岛区域在电量降至20%时,会以红色波浪动画形式弹出低电量警告,取代此前单调的弹窗提示。 视觉设计层面,主屏幕底部的“液态

  • Custouch市场易AI技术入选Topdigital2025全球AI营销图谱

    《TopDigital2025全球AI营销图谱》近日发布,Custouch市场易入选"内容智能生成"板块。该图谱为AI技术重构营销提供全链路产业地图,整合企业官网、学术报告、专利库等多维度信息。Custouch凭借AI技术在B2B营销领域的创新应用入选,其智能解决方案能有效满足企业实际需求。作为数字营销技术服务商,Custouch已为300+国际头部企业提供一站式营销管理体系,涵盖内容、活动、线索等全流程,助力企业实现高质量增长。此次入选既是对其AI成果的肯定,也是对其未来发展的激励。

  • 政策东风劲吹,StarlinkX借势启航深耕亚太蓝海

    文章概述了亚太地区在数字经济浪潮下拥抱Web3.0技术变革的趋势。随着各国出台支持政策,AI可穿戴设备制造商StarlinkX抓住机遇加速布局,其产品线凭借生物识别、健康监测和物联网体验等优势,精准契合Web3.0时代对数据隐私保护的需求。公司通过建立区域总部和研发中心,深度融入当地产业链,实现业绩快速增长。文章指出,亚太地区作为全球最具活力的数字经济增长极,正通过完善区块链激励机制、培育去中心化金融生态等措施,构建优质的数字经济发展生态圈。StarlinkX的成功印证了紧跟时代步伐的企业方能行稳致远。

  • 曝澎湃OS 3最快本月开启Beta版内测:小米16首发

    快科技8月5日消息,博主爆料各厂商将在8月陆续开启下一代操作系统Beta版内测。小米16系列预计9月发布,将搭载澎湃OS 3系统。该系统新增"灵动岛"功能,利用前置摄像头周围区域显示卡片、弹窗等信息,用户无需打开应用即可查看导航、播放进度等内容。此外,澎湃OS 3将升级AI体验,强化"超级小爱"功能,支持文字、语音、图片等多种内容识别及实时对话交互。新系统还优化了智能助手理解力,可处理更复杂的生活场景需求。(140字)

  • 小米15推送HyperOS 2.0 Beta更新:新增长按电源键与超级小爱持续对话功能

    小米昨日晚间面向小米15用户推送了HyperOS 2.0.230.18.WOCCNXM Beta版系统更新,更新包大小约为360MB。本次更新主要针对电源键功能和设备重启体验进行了优化。这也是小米15自从7月3日以来推送的第三版基于安卓16的HyperOS Beta版推送。

  • A日报:Stability AI发布实时重建模型SPAR3D;火山引擎“奇美拉”数字人平台启动封测;京东重磅开源JoyAgent-JDGenie

    AI日报栏目精选了人工智能领域最新动态:1)Stability AI推出0.7秒单图3D重建模型SPAR3D;2)GitHub热门开源AI协作框架CrewAI获3.4万星;3)马斯克发布儿童AI聊天机器人Baby Grok引发安全争议;4)ComfyUI-C opilot工具简化AI工作流创建;5)CNNIC报告显示我国346款生成式AI完成备案;6)提示词管理工具AI Gist上线;7)开源语言学习工具WordPecker支持多语言学习;8)斯坦福推出多工具协作AI Agent OctoTools;9)Ope

  • 文远知行与阿布扎比综合交通中心合作,扩大Robotaxi在阿运营范围

    2025年7月29日,文远知行与Uber合作在阿布扎比推出Robotaxi服务,覆盖阿尔雷姆岛和阿尔马里亚岛等核心区域。这是中东地区规模最大的自动驾驶车队,采用文远知行新一代GXR车型,每车可载5人。服务范围已覆盖阿布扎比近半核心区,包括主要住宅区和商业中心。自2024年12月启动以来,车队规模已增长三倍,日均完成数十次订单。该项目是阿布扎比智能交通战略的重要部分,目标到2040年实现25%公共交通依赖智能出行。合作方表示,这将推动自动驾驶技术在中东地区的主流化应用。

  • 每日互动AI一体机GAI Station:安全融合大模型与大数据 高效驱动企业业务增长

    文章介绍了GAI+Station智能工作站如何解决大模型产业应用中的安全与效率难题。该产品采用"本地小模型+云端大模型"混合部署模式,确保敏感数据不出域的同时调用大模型能力,支持27+文档格式解析和8大模型能力,可快速构建企业知识库。其特色包括:1)数据安全可控,原始数据本地处理;2)深度整合业务流与数据库,提升决策效率;3)预置16大权威知识库,支持行业定�

热文