首页 > 业界 > 关键词  > SV3D最新资讯  > 正文

Stability AI推Stable Video3D(SV3D)传图可生成3D视频

2024-03-19 10:31 · 稿源:站长之家

划重点:

- 💡 Stability AI 发布了 Stable Video3D(SV3D),这是一款用于生成3D 视频的 gen AI 工具。

- 💡 SV3D 能够从单个输入图像创建和转换多视角3D 网格,为视频生成模型增加了新的深度。

- 💡 SV3D 提供两种强大的变体,分别用于特定的使用案例,满足不同需求。

站长之家(ChinaZ.com)3月19日 消息:Stability AI 推出了 Stable Video3D(SV3D),这是一款用于生成3D 视频的新型 gen AI 工具。SV3D 是在稳定 AI 之前的 Stable Video 技术基础上开发的,该技术使用户能够从图像或文本提示中生成短视频。SV3D 构建在Stability AI 先前的 Stable Video Diffusion 模型基础上,针对新视角合成和3D 生成的任务进行了调整。通过 SV3D,Stability AI 为其视频生成模型增加了新的深度,能够从单个输入图像创建和转换多视角3D 网格。

image.png

SV3D 现在可供商业用途使用,价格为每月20美元的 Stability AI 专业会员资格(针对年收入不到100万美元的创作者和开发人员)。对于非商业用途,用户可以从 Hugging Face 下载体验模型。

SV3D 特色亮点包括:

- Stable Video3D (SV3D) 是基于 Stable Video Diffusion 的生成模型,可以接收物体的静止图像作为条件帧,并生成该物体的轨道视频。

- 该模型经过训练,可以生成分辨率为576x576的21帧视频,输入为相同分辨率的上下文帧,是从 SVD Image-to-Video 进行了微调的。

- SV3D 释放了两个模型变体:SV3D_u 可以基于单张图像输入生成轨道视频,而 SV3D_p 则扩展了 SVD3_u 的功能,支持单张图像和轨道视图,可以沿指定的相机路径创建3D 视频。

- 由 Stability AI 开发,是一种生成式图像到视频模型,遵循 StabilityAI 非商业研究社区许可协议。

- 模型的训练数据来自 Objaverse 数据集的渲染图像,使用了增强的渲染方法,更好地模拟了现实世界中的图像分布,显著提高了模型的泛化能力。

Stability AI 首席研究员 Varun Jampani 表示:“通过将我们的 Stable Video Diffusion 图像到视频扩散模型与摄像机路径调节相结合,Stable Video3D 能够生成对象的多视角视频。” 他还表示:“Stable Video3D 是生成3D 资产的有价值工具,尤其在游戏领域。此外,它还能够生产360度轨道视频,对电子商务领域非常有用,提供更具沉浸感和互动性的购物体验。”

Stability AI 最为人所知的是其 Stable Diffusion 文本到图像 gen AI 模型,其中包括 SDXL 和 Stable Diffusion3.0,后者仍处于早期研究预览阶段。稳定 Diffusion1.5是一个开源图像生成模型,是许多其他 AI 图像生成和视频产品的基础,包括 Runway 和 Leonardo AI。

去年12月,Stability AI 发布了 Stable Zero123模型,为构建3D 图像提供了新的能力。当时,Stability AI 创始人兼首席执行官 Emad Mostaque 表示,Stable Zero123将是一系列3D 模型中的第一个。

SV3D 技术与 Stable Zero123采用了不同的3D 生成方法。Jampani 解释说,Stable Video3D 可以看作是前作 Stable Zero123的改进版。Stable Video3D 是一种新型视角合成网络,以单个图像作为输入,并输出新视角图像。

在一篇研究论文中,Stability AI 研究人员详细介绍了使用潜在视频扩散实现从单个图像生成3D 的一些技术。SV3D 的关键优势之一在于其能够生成对象的一致多视角图像。根据稳定 AI 的说法,SV3D 可以从任意角度提供连贯的视图。

SV3D 不仅具有新视角合成功能,还致力于优化3D 网格。通过利用其多视角一致性,SV3D 可以直接从其生成的新视图中生成高质量的3D 网格。

SV3D 有两种强大的变体,分别针对特定的使用案例进行设计。SV3D_u 可以基于单个图像输入生成轨道视频,无需摄像机调节。而 SV3D_p 则扩展了这一功能,既可以使用单个图像,也可以使用轨道视图,允许用户沿指定的摄像机路径创建3D 视频。

体验入口:https://top.aibase.com/tool/stable-video-3d

举报

  • 相关推荐
  • 苹果iOS 26普通照片秒变3D照上热搜 “空间场景”功能引热议

    苹果正式推送iOS 26系统,支持iPhone 11及以上机型。新系统引发用户吐槽,如LiquidGlass设计被指“丑出新高度”,升级后出现发烫、卡顿等问题。但“空间场景”功能广受好评,可将普通照片转换为裸眼3D效果,操作便捷,还能设为动态壁纸。不过该功能在不同屏幕上的表现存在差异,低刷屏会出现卡顿,高刷屏则效果更流畅逼真。

  • AI日报:腾讯发布混元3D 3.0模型;昆仑万维上线Agent Studio功能;阿里Qoder推出付费订阅服务

    AI日报汇总最新行业动态:腾讯发布混元3D+3.0模型,建模精度提升3倍;昆仑万维Mureka上线音乐创作功能;阿里Qoder推出付费订阅服务;VEED Fabric 1.0实现图片转视频;OpenAI发布GPT-5-Codex革新编程;全国发布AI安全治理框架2.0;Mini-o3实现超长视觉推理;上海AI Lab推出多模态模型Lumina-DiMOO;腾讯微调技术提升图像美感300%;Meta推出轻量级MobileLLM-R1;腾讯启动AI应用繁荣计划;谷歌DeepMind�

  • 7.3GHz新纪录!HiCookie再创9800X3D+技嘉X870主板超频战绩

    技嘉2025新品发布会圆满落幕,展示X3D系列主板、OLED显示器及AI+TOP等新品,并推出D5黑科技2.0和X3D鸡血模式2.0软件更新。超频大师HiCookie现场演示液氮超频,使用技嘉X870AORUS TACHYON ICE主板搭配9800X3D处理器,创下7.3GHz超频新纪录并通过CPU-Z认证。主板专为超频设计,支持D5黑科技内存优化技术,提升带宽降低延迟,适合各类玩家轻松体验高性能。

  • IFA 2025“杰出创新奖”揭晓:三星电竞显示器以裸眼3D体验引领行业变革

    三星玄龙骑士3D电竞显示器G90XF荣获2025年IFA创新奖,凭借裸眼3D技术突破行业瓶颈。该产品通过眼球追踪和视图映射算法实现无眼镜立体视觉,同时保持4K分辨率、165Hz刷新率等顶级显示性能。结合AI视频转换功能与游戏生态建设,三星正推动显示技术从二维向三维沉浸式体验跨越,重塑行业标准。

  • AI日报:阿里推多模态模型Qwen3-Omni;谷歌推出AP2协议;百度推出Qianfan-VL 模型

    本期AI日报聚焦多领域技术突破:阿里云推出全球首个全模态AI模型Qwen3-Omni,支持文本、图像、音频和视频统一处理;百度发布多尺寸视觉理解模型Qianfan-VL,优化企业级应用。苹果扩展Image Playground平台,引入ChatGPT等第三方模型。谷歌与PayPal合作推出AP2协议,推动AI支付安全创新。钉钉上线AI表格助手,支持自然语言生成表格。DeepSeek开源V3.1-Terminus模型,性能显著提升。Kimi推出Agent会员服务,智元机器人开源全球首个通用具身智能模型GO-1,降低技术门槛促进行业创新。

  • 转人工率下降20%,成交转化率提升35%:淘宝重塑AI客服

    AI客服正在完成从“问答机”向“智能体”的转变。 2025年9月4日,淘宝发布“店小蜜5.0”,标志着AI客服正式从基于知识库配置的“工具”,进化为能思考、会决策、可行动的“智能体(Agent)”——一种能自主理解、规划并执行任务以达成目标的人工智能系统。 这不仅是技术的拐点,更是对消费者体验和商家效率的重塑。 淘天集团客户运营部技术负责人腾渊揭示了这场变�

  • 天网杯纳米AI视频创作赛圆满落幕,ISC.AI学苑推动“教育AI+”新范式

    9月23日,第三届“天网杯”网络安全大赛在天津落幕,吸引全国顶尖战队角逐,同期举办纳米AI视频创作赛。赛事聚焦个人信息保护、防诈 骗等网络安全议题,通过“以赛促学”模式提升学生防护意识与AI应用能力。ISC.AI学苑作为平台支持,依托“纳米AI”技术降低创作门槛,推动“安全+AI”人才培养。大赛评选出24个奖项,并联合多所高校深化合作,促进AI技术在教育场景的落

  • “老登”应用,霸榜AI

    AI应用的争夺战,打到哪儿了? 如果把整个AI行业想象成一座金矿:基础设施层(芯片、算力)相当于“卖铲子”,提供挖矿的基础工具;模型层(大模型研发)好比“卖地图”,告诉大家哪里有金子;而应用层是直接“下场淘金”,把金子变现。 近两年AI应用的使用者越来越多,QuestMobile数据显示,截止到2025年8月,移动端AI应用用户规模达6.45亿,PC端达2.04亿。其中原生APP亿级应用的

  • AI投资,走到哪了?

    AI赛道,从不缺少追梦人。 多年来,创业者的名单持续刷新。从“AI四小龙”时代的汤晓鸥、印奇、朱珑、周曦,到大模型爆发后的王慧文、李开复、王小川、杨植麟、闫俊杰、唐杰,再到眼下炙手可热的90后王兴兴、彭志辉、肖弘、郭文景.....众多或熟悉或陌生的名字,纷纷涌入这场AI的浪潮。 推动这股浪潮加速前进的,还有另一股力量——资本。红杉、高瓴、英诺天使、毅

  • 蚂蚁财富开放平台3.0升级:与机构全场景联合运营,开放三大AI助手

    我国“人工智能+”行动加速落地金融产业。证监会印发方案推动公募基金高质量发展,鼓励机构加大AI等新技术应用。蚂蚁财富开放平台3.0升级,面向金融机构开放三大AI助手,提升投研、运营和内容创作效率。数据显示AI已助力上百家金融机构提质增效,七成机构看好AI+金融价值。专家指出AI将广泛应用于投研自动化、风险预警等领域,推动财富管理向更高效、透明、普惠方向发展。

今日大家都在搜的词: