Open-Sora开源项目更新：可生成长达16秒、720P高清视频

2024-04-29 09:52 · 稿源：站长之家

划重点:
⭐ Open-Sora 可生成16秒，720P 高清视频
⭐ 新版本架构升级，稳定性提升
⭐ 多时间 / 分辨率 / 长宽比 / 帧率训练，支持多模态功能

站长之家（ChinaZ.com）4月29日消息:潞晨科技旗下文生视频模型开源项目 Open-Sora 近日进行了重大更新，新版本可以生成16秒时长、720P 高清视频。

在本次更新中，团队对1.0版本的 STDiT 架构进行了关键性改进，提高了模型的训练稳定性和整体性能。新版本采用了多阶段训练方法，有效地提升了视频生成质量，训练流程中引入了 QK 归一化技术和旋转位置编码。此外，Open-Sora 还支持多时间、分辨率、长宽比和帧率的训练，具备多模态功能，可以处理文本到图像、文本到视频、图像到视频等任务。

Open-Sora 的架构升级和训练流程优化使得视频生成更加稳定和高效。团队引入了掩码策略来支持图像和视频的条件化处理，提供了详细的掩码策略配置指南，增强了模型在处理图像条件化任务时的学习效果。另外，在数据收集和预处理方面，团队建立了自动化的流程，包括场景分割、字幕处理、数据评分与筛选等步骤，优化了数据集的质量和数量。

Open-Sora 的更新版本在模型稳定性、训练效率和功能扩展等方面都取得了显著进展，为用户提供了更加强大和多样化的视频生成能力。

项目入口:https://top.aibase.com/tool/open-sora

（举报）

相关推荐

关键词：

Sora App的AI视频社交，给了百度们新希望

Sora2发布两周后，百度的蒸汽机AI视频模型，和谷歌Veo3.1撞了档期。两家公司选择同期发布并非有多默契，而是Sora2带来的压迫感促使它们不得不加快脚步。奥尔特曼将形容Sora2为“创意领域的ChatGPT3.5时刻”，不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃，还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。这无疑是扔在AI视�

文章搜索核心标签 AI视频模型
荐狂奔20天，全网“追赶”Sora2

Sora2的发布，再次搅动了全球人工智能行业的神经。 9月30日，OpenAI正式推出其视频生成模型的重大升级版本——Sora2，以及基于该模型的社交应用Sora App。与前一代相比，Sora2在物理模拟的精确度、画面逼真度和生成可控性上显著提升，并实现了音频与人物对话的同步生成。这不仅让AI视频更“像真的”，也让视频生产“像写字”一样简单。短短五天，Sora App下载量便突破百万�

Sora2 人工智能视频生成模型
AI日报：Google Skills平台向公众免费开放内部AI知识；LiblibAI 完成1.3亿美元融资；Sora更新推出“角色客串”功能

本期AI日报聚焦视频生成领域重大进展：昆仑万维SkyReels将于11月上线新版AI视频工具；LiblibAI完成1.3亿美元融资；阿里推出夸克对话助手；豆包视频模型Seedance1.0pro实现首尾帧一致性突破；Vidu Q2全面开放API；Sora新增角色客串功能并即将推出安卓版；MiniMax海螺2.3在真实感方面超越Veo；谷歌推出免费AI学习平台"Google Skills"；字节跳动Seed团队发布3D生成模型Seed3D1.0，支持单图生成高质量3D资产。

AI视频昆仑万维 SkyReels
荐Sora2之后，又来了个全新的影视级AI视频模型，它的名字，叫GAGA。

Sora2爆火之后，随之而来的AI视频领域的新产品。来自我的好朋友，曹越老师的Sand.ai。凌晨，他们终于上线了他们全新的音画同步视频模型GAGA-1，在人物表演上，我觉得，已经算是现在的TOP级了。

AI视频 GAGA-1 音画同步
荐即梦VS可灵，谁能「对标」Sora2？

AI视频的战争，才刚刚开始。在生成式AI的大航海时代，文字、图像、代码的疆界已相继被重绘，唯独“视频”这一最复杂、最昂贵、最具传播势能的内容形态，始终处在被技术反复叩门却未彻底攻陷的高地。这个局面，似乎终于要被OpenAI在10月1日推出的Sora2而改变。

AI视频生成式AI Sora2
荐AI日报：LiblibAI 2.0正式上线；通义千问、豆包开启记忆功能；Sora已登陆Google Play

本期AI日报聚焦多项重要进展：LiblibAI 2.0上线，内置多模型并提供限时免费算力；通义千问和豆包开启记忆功能内测；OpenAI视频生成应用Sora登陆Google Play并开放北美预注册；Qoder推出提示词增强功能提升开发效率；Cherry Studio集成主流AI模型并推出优惠活动；港中文团队推出首个结构化图像生成系统；DeepSeek入选2025全球十大工程成就。这些突破展示了AI技术快速迭代与多领域应用�

AI日报 LiblibAI 2.0
荐AI日报：视觉中国与多家大模型公司达成合作；OpenAI紧急暂停Sora生成已故名人；谷歌推出Gemini地图数据集成工具

视觉中国与多家AI公司合作开发可商用视觉大模型，已获阿里、微软等订单。OpenAI因不当内容暂停Sora生成马丁·路德·金形象视频，引发AI伦理讨论。DeepSeek在加密货币交易实验中表现领先。WhatsApp将禁止第三方通用AI聊天机器人，仅保留Meta AI。宇树科技推出仿人机器人Unitree H2，具备拟人化设计。谷歌为Gemini集成地图数据工具，可访问25亿地点实时信息。Opera推出集成三款AI助手的Neon浏览器，但用户体验存在困惑。Facebook在美加推出AI照片编辑建议功能，可分析手机未分享照片。

AI 视觉大模型版权合规
荐AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；Sora2免费用户可生成15秒视频

本期AI日报聚焦多项技术更新：谷歌Veo 3.1视频模型新增音频生成与精细化编辑功能；通义千问推出记忆功能提升对话连贯性；Sora2免费用户可生成15秒视频，Pro版支持25秒；百度文心助手升级8种创作模式；谷歌Flow工具增强视频光影编辑与音频合成能力；Anthropic发布高性价比Claude Haiku 4.5；北京查处首例AI虚假广告案，涉伪造主持人带货；阿里推出响应仅200毫秒的编程工具Qoder CLI。

AI 视频生成谷歌
Sora 2生成已故名人视频引亲属不满 OpenAI回应：重视反馈将迅速纠正失误

OpenAI 近日推出的 Sora 2 模型引发广泛关注，其默认禁止生成在世公众人物视频，用户纷纷尝试生成各类创意内容。然而，创作者与观众很快发现这一限制存在明显漏洞该模型允许生成已故公众人物的影像，从而在伦理层面引发争议。社交媒体上已涌现大量AI复活”名人的案例，例如李小龙主持DJ现场、迈克尔杰克逊表演单口喜剧等。尽管OpenAI在每段生成视频上添加动态水印，�

OpenAI Sora 2模型
OpenAI也来了，巨头为何决战AI浏览器？

AI浏览器赛道再添一位重量级玩家——ChatGPT Atlas，这是OpenAI推出的首款人工智能驱动的网页浏览器。这也被外界认为OpenAI要向谷歌宣战，挑战Chrome一直以来的浏览器霸王地位。ChatGPT Atlas发布当天，谷歌母公司Alphabet股价应声下挫，盘中最大跌幅接近5%，足见市场对这一新品的敏感度。近一年来，AI浏览器的战略价值成为行业共识，从业者更是将其与智能代理（Agent）、搜索引�

AI浏览器 ChatGPT Atlas

今日大家都在搜的词：

热文

3 天
7天

Open-Sora开源项目更新：可生成长达16秒、720P高清视频

Sora App的AI视频社交，给了百度们新希望

荐狂奔20天，全网“追赶”Sora2

AI日报：Google Skills平台向公众免费开放内部AI知识；LiblibAI 完成1.3亿美元融资；Sora更新推出“角色客串”功能

荐Sora2之后，又来了个全新的影视级AI视频模型，它的名字，叫GAGA。

荐即梦VS可灵，谁能「对标」Sora2？

荐AI日报：LiblibAI 2.0正式上线；通义千问、豆包开启记忆功能；Sora已登陆Google Play

荐AI日报：视觉中国与多家大模型公司达成合作；OpenAI紧急暂停Sora生成已故名人；谷歌推出Gemini地图数据集成工具

荐AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；Sora2免费用户可生成15秒视频

Sora 2生成已故名人视频引亲属不满 OpenAI回应：重视反馈将迅速纠正失误

OpenAI也来了，巨头为何决战AI浏览器？

今日大家都在搜的词：

热文

华为nova Flip S小折叠开售：首发3388元起

雷军回应K90定价：最近内存涨价太多希望大家理解这份诚意

苹果首款2nm手机芯片上热搜 A20由iPhone 18系列首发

REDMI K90标准版12+512GB降价300元小米回应：可退差价

小米汽车发布跨年购置税补贴方案至高不超15000元

卢伟冰：REDMI K90标准版12+512首销月直降300 售价2899元

五大升级！红米REDMI K90标准版采用6.59英寸黄金中尺寸

AI日报：阿里夸克“C计划”曝光；Veo3.1将增加视频“精确编辑”

iOS 26液态玻璃效果能关了苹果iOS 26.1 Beta 4新增液态玻璃开

华为nova Flip S小折叠开售：首发3388元起

兰博基尼联名！REDMI K90 Pro Max冠军版官宣

真我GT8发布：售价2899元起骁龙8至尊版双芯

微信三大更新放出上热搜涉及群聊消息处理、消息撤回等

AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个

余承东官宣华为路由X3 Pro 采用“日照金山”设计

红米REDMI K90标准版亮相：质感、工艺脱胎换骨

站长商机