首页 > 业界 > 关键词  > Open-Sora最新资讯  > 正文

Open-Sora开源项目更新:可生成长达16秒、720P高清视频

2024-04-29 09:52 · 稿源:站长之家

划重点:

Open-Sora 可生成16秒,720P 高清视频

⭐ 新版本架构升级,稳定性提升

⭐ 多时间 / 分辨率 / 长宽比 / 帧率训练,支持多模态功能

站长之家(ChinaZ.com)4月29日 消息:潞晨科技旗下文生视频模型开源项目 Open-Sora 近日进行了重大更新,新版本可以生成16秒时长、720P 高清视频。

image.png

在本次更新中,团队对1.0版本的 STDiT 架构进行了关键性改进,提高了模型的训练稳定性和整体性能。新版本采用了多阶段训练方法,有效地提升了视频生成质量,训练流程中引入了 QK 归一化技术和旋转位置编码。此外,Open-Sora 还支持多时间、分辨率、长宽比和帧率的训练,具备多模态功能,可以处理文本到图像、文本到视频、图像到视频等任务。

Open-Sora 的架构升级和训练流程优化使得视频生成更加稳定和高效。团队引入了掩码策略来支持图像和视频的条件化处理,提供了详细的掩码策略配置指南,增强了模型在处理图像条件化任务时的学习效果。另外,在数据收集和预处理方面,团队建立了自动化的流程,包括场景分割、字幕处理、数据评分与筛选等步骤,优化了数据集的质量和数量。

Open-Sora 的更新版本在模型稳定性、训练效率和功能扩展等方面都取得了显著进展,为用户提供了更加强大和多样化的视频生成能力。

项目入口:https://top.aibase.com/tool/open-sora

举报

  • 相关推荐
  • AI日报:小米发布Agent产品Xiaomi miclaw;OpenAI 发布 GPT-5.4系列;微软宣布必应视频全面接入Sora2模型

    本期AI日报涵盖多项重要动态:小米发布首款移动端Agent产品Xiaomi miclaw,基于自研MiMo大模型,旨在实现智能终端自动化交互。OpenAI推出GPT-5.4系列模型,包括标准版、推理版和高性能版,上下文窗口达百万级,在金融和法律领域表现优异。微软宣布必应视频创作者全面接入Sora2模型,提供免费高质量视频生成服务。Roblox推出AI实时改写功能,将违规内容自动转为礼貌合规语言。3D生成模型公司VAST获5000万美元融资,由阿里巴巴领投,将用于构建UGC互动生态。携程下线自动调价工具,推动酒店行业转向服务竞争。陈天桥九年后首度露面,透露正投入20亿美元研发“发现式AI”。阿里巴巴澄清千问团队集体离职传闻,称团队稳定,服务正常。

  • 千问首款AI硬件 千问AI眼镜G1开售:首创热插拔换电 无限续航 国补1997元起

    千问AI眼镜G1今日开售,叠加国补后到手价1997元起。作为千问首款AI硬件,G1全面接入千问APP,首批点外卖、订酒店等功能预计3月底开放。产品采用轻量化设计,重约40g,配备8mm极细镜腿,佩戴体验接近普通光学眼镜。搭载最新千问大模型,支持实时对话、快问快答、拍题答疑、AI同声传译、扫码支付、行程提醒等功能。硬件方面,配备高通骁龙AR1和恒玄BES2800双旗舰芯片,内置64GB存储空间,拥有5麦克风阵列、骨传导技术以及大振膜双音圈扬声器。综合续航9小时,首创右镜腿热插拔换电技术,搭配额外2次满电续航空的MiniBag换电仓,实现换电不断电。影像上,采用行业首创Super+Raw暗光增强技术,显著提升暗光环境拍摄画质与稳定性,夜景环境下也能稳定出片。并且具备手机级影像技术,可实现0.6秒极速抓拍、3K视频录制,并通过AI超分超帧技术输出4K视频。

  • 单部播放破2亿!AI漫剧“狂飙”,大厂厮杀正酣

    ​2026年,短剧赛道迎来首个“漫剧春节档”。 《西游,错把玉帝当亲爹》《大小姐,你把恶魔执事调成啥了》等多部漫剧作品强势破圈,不仅创下惊人播放数据,更标志着漫剧从“小众赛道”正式走向大众视野,完成了从“陪跑”到“主角”的身份转变。 这场爆火并非偶然,背后是漫剧行业的持续迭代升级。 而百度、美团等大厂还在争相入场,漫剧赛道将迎来全新的竞争�

  • “龙虾”狂热:ChatGPT们只是AI的后端,OpenClaw让AI真正有了前端

    Agent 这个词,AI 行业喊了至少两年。2024年起,每一场发布会都在谈 Agent,投资机构管它叫下一个万亿市场,创业公司一夜之间改了 slogan。但打开产品一看,还是一个对话框等你打字:你给指令,它给回答;你不提问,它就停在那儿。 概念跑得很快,产品形态没跟上。直到 OpenClaw 出来,这种错位才突然变得可见——不是因为它发明了什么新技术,而是它把那层一直缺失的交互前�

  • 当AI读懂衣物需求 三星AI神 黑钻热泵洗烘旗舰何以攻克洗衣难关

    三星AI神+黑钻热泵洗烘旗舰通过技术创新,将洗衣与烘干两大工序完美融合,解决了传统洗烘一体机烘干效率受限的问题。其采用AI智能识别衣物材质、重量与脏污程度,自动设定洗涤时长与用量,实现“因衣而异”的智能决策。同时,语音交互功能让操作更便捷自然,而AI VRT+技术则能有效抑制振动噪音,打破夜间洗衣限制。这款产品以突破性技术重新定义洗衣体验,为用户带来前所未有的舒适与便捷。

  • 别让AI毁了四大名著 微信8000余条AI魔改视频下架

    谁能想到,在AI魔改下,关羽竟然能端起狙击枪,林黛玉也能倒拔垂杨柳。这些看起来有些抽象”甚至滑稽的画面,如今终于被清理了。 微信对此重拳出击,2026年以来已累计处置超8000条AI魔改违规视频,其中1月处置4376条,2月再处置3956条,坚决遏制经典内容被恶意篡改的乱象。 这些违规AI魔改内容乱象百出,不少创作者对《三国演义

  • 这届AI春节,百度的里面、涨面和赢面

    毫无疑问,这是迄今为止AI含量最高的一个春节。这既是繁荣,也折射出一种被FOMO(错失恐惧症)裹挟的行业情绪。 AI红包雨降落背后,是互联网大厂对AI入口的争夺,也是在探索下一代人机交互新的可能性。 在这场战役中,我们看到互联网大厂AI战略路线的分野:是从0-1构建全新的AI入口,还是在现有

  • 10亿次AI创作背后:元宝用“社交”加速AI全民化

    2026年的马年春节,互联网圈最热闹的话题,是一场总额超过45亿元的“AI红包大战”。 模型技术已经成熟,但AI应用能不能真正走进普通人的生活这个问题,第一次有了可以量化的答案。 这场大战,腾讯元宝、字节豆包、阿里千问、百度文心一言悉数参与,最近最受关注的,是元宝公布的两组数据。 一组是用户规模:日活跃用户(DAU)突破5000万,月活跃用户(MAU)达到1.14亿,�

  • 受够父母毒鸡汤的年轻人,用AI造了一个赛博嘴替

    ​毒鸡汤界终于迎来了年轻人自己的“真专家”。 最近,一个名为“老赵讲道理”的公众号迅速蹿红,仅用两个月时间就从0-1涨粉超20万,10万+爆文超9篇。 看着账号介绍中的“发表过十余篇SCI论文”,你以为这是学界大佬下凡做公众号?其实这是一位名叫“是草莓味的猫”的年轻人因为受不了父母时常转发营销号毒鸡汤,开了一个公众号专门和父母魔法对轰。

  • 生活万物皆可AI 三星AI神 冰箱9系打破创新边界 化身可靠家庭成员

    三星AI神+冰箱9系通过AI技术革新冰箱功能,实现食材智能识别与管理,语音交互解放双手,并优化能耗设计。它不仅是保鲜工具,更能记录家庭饮食习惯,推荐食谱,无缝融入厨房空间,成为理解用户需求的“沉默家人”。

今日大家都在搜的词: