首页 > 业界 > 关键词  > 正文

Stability AI 推出稳定视频扩散 API 插件引起争议

2023-12-22 10:09 · 稿源:站长之家

站长之家(ChinaZ.com) 12月22日 消息:Stability AI,以其稳定扩散文本到图像生成器而著称的公司,近日宣布推出新的基础图像到视频模型——稳定视频扩散(Stable Video Diffusion,SVD),并已在其开发者平台上通过应用程序编程接口(API)提供。

这一举措允许第三方开发者将该模型整合到他们的应用程序、网站、软件和服务中。

该公司在一篇博客文章中写道:“这一新功能提供了对专为各个领域设计的最先进视频模型的编程访问……我们发布此版本的目标是为开发人员提供一种有效的方法,将高级视频生成无缝集成到他们的产品中。”

AI画画机器人作画绘画

虽然这一版本为希望生成AI视频的企业提供了新的选择,但也引起了一些担忧。此前,Stability AI因在名为LAION-5B的开源AI数据集上训练其模型而受到批评。该数据集被发现包含至少1,008个涉及儿童性虐待的视频实例,因而在本周被下线。

尽管存在争议,但Stability的新SVD API插件在视频生成方面提供了领先的选择之一,可以生成包括25个生成的帧和24个生成的帧在内的“2秒视频”, FILM插值,平均时间为41秒。

此外,Stability还计划为其视频生成器推出面向用户的网络体验,尽管尚未透露推出时间。该公司正在邀请用户加入等待名单,成为第一批试用该界面的用户。

值得注意的是,尽管存在争议,但Stability AI的开发者平台API提供对所有公司模型的访问,从稳定扩散XL文本到图像生成器到新的SVD模型。该公司还提供会员资格,帮助客户在本地托管模型。

举报

  • 相关推荐
  • 某幻君助力索尼原创音浪季,BilibiliWorld 现场解锁音频黑科技

    索尼在BilibiliWorld展会上打造沉浸式音乐体验,以"为音乐而生"理念呈现专业音频设备组合。现场设置录音棚体验区,观众可使用C-80麦克风和MDR-M1监听耳机感受专业录音效果。同时展出旗舰降噪耳机WH-1000XM6等产品,展现索尼70年音频技术积淀。活动还推出"索尼原创音浪季"赛事,邀请B站UP主某幻君等音乐人现场表演,通过前沿科技支持音乐创作。索尼中国高管现场

  • AI日报:字节将发布AI编程工具TRAE2.0版本;Mistral重磅推出音频模型Voxtral;月之暗面回应Kimi K2 API速度慢

    AI日报栏目聚焦AI领域最新动态:1)字节跳动将发布TRAE 2.0编程工具,新增语音交互功能;2)Mistral推出开源音频模型Voxtral,支持多语言;3)月之暗面回应Kimi K2API速度慢问题,正在优化系统;4)昆仑万维发布AgentOrchestra框架,实现多智能体协作;5)OpenAI前CTO创立的Thinking Machines Lab获20亿美元融资;6)Kimi-2上线,性能超越GPT-4.1;7)TRAE推出Kimi-K2模型服务,国际版支持Grok-4;8)字节跳动Seed�

  • iTAP完成“大考”,这些应用场景将率先落地!

    2025年7月11日,首届iTAP测试大会在西安成功举办。华为、支付宝、华大电子等产业链头部企业共同完成了支付、门禁、票务三大场景下的协议互通性验证,标志着iTAP技术正式通过商用化验证。华为Pura80手机和Watch GT5智能手表成为首批通过全部测试的设备。测试结果显示,iTAP技术突破传统NFC协议痛点,交互效率提升300%,支持存量设备通过软件升级接入,显著降低硬件迭代成本。产业协同效应显现,多家芯片厂商已制定明确技术路线图,加速生态布局。未来iTAP技术将在智慧交通、数字生活等领域加速商业化落地,ITMA协会拟于2025年第四季度再次举办测试大会,持续推动产业协同发展。

  • Perplexity推出AI浏览器Comet:想用得开1400元/月的订阅

    由英伟达支持的Perplexity AI推出了一款名为Comet的AI驱动网络浏览器。 Comet浏览器的核心卖点是其AI驱动的交互体验,公司表示它将整个浏览会话转变为单一、无缝的交互,将复杂的工作流程简化为流畅的对话。

  • 推荐几个国内比较主流的API管理平台

    本文介绍了国内主流的API管理平台,包括Apifox、RestCloud iPaaS、YApi、API Umbrella、Postcat、白山云和数环通。这些平台各具特色:Apifox集文档、调试、Mock和测试于一体;RestCloud iPaaS支持AI助手和300+ SaaS应用连接;YApi适合跨语言开发团队;API Umbrella提供多团队协同和实时监控;Postcat轻量可扩展;白山云专注企业级全流程管理;数环通主打智能化自动化。企业应根据自身规模、行业需�

  • 马斯克xAI推出Grok - 4 大模型将至,Meta/微美全息深耕开源AI融合加速

    埃隆·马斯克旗下xAI即将发布Grok-4大模型,该模型将在语言、数学和推理方面超越OpenAI和谷歌最新AI产品。同时苹果低调收购两家AI公司TrueMeeting和WhyLabs,加速布局Vision Pro头显和Apple Intelligence领域。Meta计划投入数百亿美元扩建AI基础设施,扎克伯格亲自招募顶尖AI人才。微美全息聚焦高性能算力与多模态模型,推动AI产业升级。当前AI赛道竞争激烈,大模型正向通用多模态演进,商业化落地成为关键。

  • 苹果发布iOS 18.6开发者预览版Beta 3:国行AI遥遥无期

    今日,苹果向iPhone用户推送了iOS 18.6开发者预览版Beta 3。 开发者可在兼容设备上通过设置”应用,进入通用软件更新”下载该测试版。 目前尚未发现有可见更新内容,不过此前有消息称,iOS 18.6将会针对欧盟地区用户进行实用性更新。 苹果当前在欧盟地区的iOS版本虽然支持上述两种行为,但会插入一些警告屏幕,这引起了欧盟监管机构的关注,将会进行一些调整。 值得注意�

  • Mistplay发布iPhone版手游忠诚度应用及LoyaltyPlay变现方案

    2025年7月15日,全球手游忠诚度应用Mistplay在成立十周年之际推出两款新产品:iPhone版应用和变现方案LoyaltyPlay。Mistplay通过"玩赚"模式连接玩家与发行商,安卓版已覆盖全球九大市场,拥有数百万活跃用户。新产品将为中国开发者提供全新获客渠道和变现途径,同时通过AI引擎"Helios"和实时运营系统提升用户体验。公司持续投资亚太市场,帮助本地开发者拓展全球业务。iPhone版已上线美加应用商店,未来将扩展至更多地区。

  • AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

    本文介绍了AI日报栏目及近期AI领域多项突破性进展:1)智谱推出免费AI Slides工具,基于GLM模型快速生成高质量PPT;2)可灵AI发布可图2.1模型,支持180多种风格图像生成;3)NVIDIA推出DiffusionRenderer技术,实现视频到可编辑3D场景转换;4)墨刀AI新增30秒生成高保真原型功能;5)Higgsfield推出Soul ID工具,10张照片即可生成虚拟形象;6)谷歌DeepMind开源GenAI Processors工具库;7)谷歌Veo新增图像转视频功能;8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。

  • Meta高薪挖人!苹果AI大牛跳槽了

    Meta首席执行官扎克伯格正以高薪挖角竞争对手的AI人才,苹果一名核心工程经理已决定跳槽加入。 据悉,负责苹果基础模型团队的Ruoming Pang从苹果跳槽至Meta,他曾在苹果管理着约100名员工的团队,该团队致力于苹果大型语言模型的研发。 Ruoming Pang团队开发的模型已经应用到iPhone中,比如邮件摘要、生成式表情(Genmoji)等等。 Meta以每年数千万美元的待遇成功吸引了Ruoming Pan