Stability AI推Stable Video3D（SV3D）传图可生成3D视频

2024-03-19 10:31 · 稿源：站长之家

划重点:
- 💡 Stability AI 发布了 Stable Video3D（SV3D），这是一款用于生成3D 视频的 gen AI 工具。
- 💡 SV3D 能够从单个输入图像创建和转换多视角3D 网格，为视频生成模型增加了新的深度。
- 💡 SV3D 提供两种强大的变体，分别用于特定的使用案例，满足不同需求。

站长之家（ChinaZ.com）3月19日消息:Stability AI 推出了 Stable Video3D（SV3D），这是一款用于生成3D 视频的新型 gen AI 工具。SV3D 是在稳定 AI 之前的 Stable Video 技术基础上开发的，该技术使用户能够从图像或文本提示中生成短视频。SV3D 构建在Stability AI 先前的 Stable Video Diffusion 模型基础上，针对新视角合成和3D 生成的任务进行了调整。通过 SV3D，Stability AI 为其视频生成模型增加了新的深度，能够从单个输入图像创建和转换多视角3D 网格。

SV3D 现在可供商业用途使用，价格为每月20美元的 Stability AI 专业会员资格（针对年收入不到100万美元的创作者和开发人员）。对于非商业用途，用户可以从 Hugging Face 下载体验模型。

SV3D 特色亮点包括:

- Stable Video3D （SV3D）是基于 Stable Video Diffusion 的生成模型，可以接收物体的静止图像作为条件帧，并生成该物体的轨道视频。
- 该模型经过训练，可以生成分辨率为576x576的21帧视频，输入为相同分辨率的上下文帧，是从 SVD Image-to-Video 进行了微调的。
- SV3D 释放了两个模型变体:SV3D_u 可以基于单张图像输入生成轨道视频，而 SV3D_p 则扩展了 SVD3_u 的功能，支持单张图像和轨道视图，可以沿指定的相机路径创建3D 视频。
- 由 Stability AI 开发，是一种生成式图像到视频模型，遵循 StabilityAI 非商业研究社区许可协议。
- 模型的训练数据来自 Objaverse 数据集的渲染图像，使用了增强的渲染方法，更好地模拟了现实世界中的图像分布，显著提高了模型的泛化能力。

Stability AI 首席研究员 Varun Jampani 表示:“通过将我们的 Stable Video Diffusion 图像到视频扩散模型与摄像机路径调节相结合，Stable Video3D 能够生成对象的多视角视频。” 他还表示:“Stable Video3D 是生成3D 资产的有价值工具，尤其在游戏领域。此外，它还能够生产360度轨道视频，对电子商务领域非常有用，提供更具沉浸感和互动性的购物体验。”

Stability AI 最为人所知的是其 Stable Diffusion 文本到图像 gen AI 模型，其中包括 SDXL 和 Stable Diffusion3.0，后者仍处于早期研究预览阶段。稳定 Diffusion1.5是一个开源图像生成模型，是许多其他 AI 图像生成和视频产品的基础，包括 Runway 和 Leonardo AI。

去年12月，Stability AI 发布了 Stable Zero123模型，为构建3D 图像提供了新的能力。当时，Stability AI 创始人兼首席执行官 Emad Mostaque 表示，Stable Zero123将是一系列3D 模型中的第一个。

SV3D 技术与 Stable Zero123采用了不同的3D 生成方法。Jampani 解释说，Stable Video3D 可以看作是前作 Stable Zero123的改进版。Stable Video3D 是一种新型视角合成网络，以单个图像作为输入，并输出新视角图像。

在一篇研究论文中，Stability AI 研究人员详细介绍了使用潜在视频扩散实现从单个图像生成3D 的一些技术。SV3D 的关键优势之一在于其能够生成对象的一致多视角图像。根据稳定 AI 的说法，SV3D 可以从任意角度提供连贯的视图。

SV3D 不仅具有新视角合成功能，还致力于优化3D 网格。通过利用其多视角一致性，SV3D 可以直接从其生成的新视图中生成高质量的3D 网格。

SV3D 有两种强大的变体，分别针对特定的使用案例进行设计。SV3D_u 可以基于单个图像输入生成轨道视频，无需摄像机调节。而 SV3D_p 则扩展了这一功能，既可以使用单个图像，也可以使用轨道视图，允许用户沿指定的摄像机路径创建3D 视频。

体验入口:https://top.aibase.com/tool/stable-video-3d

（举报）

相关推荐

关键词：

1299元起售！iPhone Pocket发布：采用3D 针织一体结构

今日下午，苹果发文称，三宅一生携手苹果正式推出新配件iPhone Pocket。其中短带款提供八种色彩外观：柠檬色、柑橘色、紫色、粉色、孔雀绿色、宝石蓝色、肉桂色和黑色。长带款提供三种色彩外观：宝石蓝色、肉桂色和黑色。短带款iPhone Pocket售价为1299元，长带款售价为1899元。

苹果 iPhone Pocket
千元卧室投影推荐：实测大眼橙C3D画质/性能/体验都能打

大眼橙C3D投影仪专为卧室场景设计，小巧机身节省空间，支持自动对焦和梯形校正，操作便捷。配备一体化云台，可360°旋转调节角度，轻松适配不同观影姿势。画质表现优秀，1080P分辨率兼容4K解码，850CVIA亮度确保开灯环境下画面清晰，MEMC运动补偿避免拖影。内置低噪音设计和卧室模式，兼顾安静与舒适观影体验，结合腾讯视频AI语音助手，实现智能操控。整体精准契合卧室娱乐需求，提升幸福感。

双11购物清单提升卧室幸福感卧室投影仪
告别电脑与线缆！Toucan无线一体式3D扫描仪双十一首发特惠，锁定11550元尝鲜价

积木易搭发布新款无线一体式3D扫描仪Toucan，已在京东、天猫旗舰店首发上线。新品具备无线一体设计，无需连接电脑即可独立完成扫描建模全流程，支持大、中、小不同幅面物体扫描，精度达0.03mm，并搭载双镜头模组与双功率模式，适应多种作业场景。首发期间优惠价11550元，活动持续至11月30日，助力3D创作者高效完成数字内容制作。

3D扫描仪新品首发无线一体式
小米智能门锁M40 Pro发布：售价3229元起 33D人脸+掌静脉

小米正式发布智能门锁M40 Pro，预售价3229.15元，叠加补贴后低至2880.4元。配备5英寸高清大屏与AI双摄全景猫眼，实现无死角监控；搭载6颗夜视补光灯，支持多种夜视模式。提供12种开锁方式，包括创新AI掌静脉识别（解决老人指纹磨损问题）和AI 3D人脸识别（防伪检测）。采用自研降噪全自动锁体，支持双电池供电（总续航10.5个月），新增门内长时插线充电功能，支持Type-C应急供电和手机无线反向充电。

小米智能门锁 M40Pro预售智能门锁优惠
荐横扫拉美、力压字节系，「AI届的4399」成为出海AI应用新王？

在 Sensor Tower 发布的 Q3应用出海榜单中，我们注意到了一个特别的 AI 应用「Seekee」。它空降下载榜 Top9，是当季度在海外获得最多下载量的出海 AI 应用，而由字节跳动出品、近一段时间炙手可热的「Cici」尽管排名上涨，但仅位列第13。

AI应用出海榜单下载榜
荐AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推出小度AI眼镜Pro

国家广电总局宣布自2026年3月起全面整治AI生成内容，要求AIGC作品纳入分类分层审核体系。360发布《大模型安全白皮书》，提出全链路AI安全防线应对新型威胁。百度推出2299元小度AI眼镜Pro，集成智能翻译等多项功能。StepFun开源音频编辑模型Step-Audio-EditX，实现文本化语音编辑。Grok新增纯文本生成视频功能，17秒可生成带特效视频片段。研究发现谷歌Veo-3模型能生成逼真手术视频但缺乏医学逻辑。阿里Qwen3-Max-Thinking在全球数学竞赛夺冠，并在加密货币交易中取得显著回报。OpenAI推出轻量化GPT-5 Codex Mini模型，优化开发者体验。

AI动画广电总局 AIGC审核
技嘉发布X3D系列主板：专为AMD X3D处理器打造，游戏性能提升高达25%

技嘉推出专为AMD Ryzen X3D处理器优化的X870E AORUS X3D系列主板，首发型号包括MASTER与PRO两款。该系列搭载X3D鸡血模式2.0技术，通过AI智能场景识别可自动优化处理器性能，游戏性能最高提升25%。主板采用全快易拆设计，配备免螺丝M.2插槽、磁吸散热装甲及一键拆卸显卡插槽。集成AI黑科技2.0支持DDR5内存超频至9000MT/s+，预装网卡驱动实现开机即联网。两款主板均提供4年质保（含1年免费换新），现已在各大电商平台上市。

技嘉主板 AMD Ryzen
华为官方文档确认：Mate 80全系支持3D人脸

华为Mate80系列预计11月发布，含标准版、Pro版及RS大师版四款。官方文档显示全系支持3D人脸识别，但标准版配置待确认。后摄模组采用居中圆形设计，搭载首发的麒麟9030芯片及鸿蒙OS 6系统，性能将提升。顶配RS版配备6.9英寸双层OLED屏，亮度更高功耗更低，并可能支持eSIM功能。

HarmonyOS 华为Mate80 3D人脸识别
用了3个月GEO监控，我发现品牌在AI推荐中的5个真相

文章探讨AI搜索时代企业面临的新挑战：用户转向ChatGPT、豆包等平台直接提问，导致传统搜索引擎询盘量下降。核心提出GEO品牌监控概念，需关注品牌在AI推荐中的曝光率、排名位置、提及场景等5个关键指标。通过工具持续监控并优化内容，可提升AI搜索可见性。数据显示GEO投入回报率达1:3.71，建议企业尽早布局抢占新兴流量入口。
免费体验｜教你3招提升品牌在AI回答中的被提及率，让“品牌AI搜索排名”不再难！

随着生成式AI搜索成为主流，品牌曝光正从网页排名转向“AI回答中被提及”。本文提出三招提升品牌在AI回答中的提及率：打造AI友好型内容结构（标题+问题式开头+FAQ+Schema标记）；构建品牌在AI语义体系中的信源资产；通过AIBase免费工具持续监控优化。研究显示，采用GEO优化后品牌在AI回答中的推荐率平均提升260%。

生成式AI搜索品牌提及率 GEO优化

今日大家都在搜的词：

热文

3 天
7天

Stability AI推Stable Video3D（SV3D）传图可生成3D视频

1299元起售！iPhone Pocket发布：采用3D 针织一体结构

千元卧室投影推荐：实测大眼橙C3D画质/性能/体验都能打

告别电脑与线缆！Toucan无线一体式3D扫描仪双十一首发特惠，锁定11550元尝鲜价

小米智能门锁M40 Pro发布：售价3229元起 33D人脸+掌静脉

荐横扫拉美、力压字节系，「AI届的4399」成为出海AI应用新王？

荐AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推出小度AI眼镜Pro

技嘉发布X3D系列主板：专为AMD X3D处理器打造，游戏性能提升高达25%

华为官方文档确认：Mate 80全系支持3D人脸

用了3个月GEO监控，我发现品牌在AI推荐中的5个真相

免费体验｜教你3招提升品牌在AI回答中的被提及率，让“品牌AI搜索排名”不再难！

今日大家都在搜的词：

热文

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

雷军回应小米双11战绩：谢谢大家支持

卢伟冰：小米手机双11连续三年国产销量第一

AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

95岁巴菲特每周还上5天班此前计划年底退休

华为Mate 70 Air今日开售：处理器双版本可选售价4199元起

微信宣布治理恶意外部链接：6类违规内容将遭限访

中国移动北斗卫星短信业务升级：支持文字+图片+语音

京东发布双11战报：订单总量增长近60% 下单用户同比增长40%

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

雷军回应小米双11战绩：谢谢大家支持

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

卢伟冰：小米手机双11连续三年国产销量第一

OPPO Reno15系列定档11月17日发布

焕新享界S9开卖72小时预订突破8000台

华为Mate 70 Air维修备件价格公布：换主板2499元

AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

特斯拉磁悬浮Cybertruck车模上架中国官网售价999元

站长商机