首页 > 业界 > 关键词  > Open-Sora最新资讯  > 正文

Open-Sora 1.1发布 视频质量提升,生成时长延长至21秒

2024-05-28 10:23 · 稿源:站长之家

站长之家(ChinaZ.com)5月28日 消息:Open-Sora1.1发布,带来了显著的提升,尤其是在视频生成的质量和时长方面。新版本模型能够生成最长约为21秒的视频,使用更高质量的视觉数据和字幕进行训练,从而使其更好地理解世界的运作。此外,优化后的CausalVideoVAE架构提高了性能和推理效率。

gif.gif

主要更新和特点:

  • 视频生成质量和时长提升:新版本在视频生成的质量和时长方面都有显著提升,现在能够生成最长约为21秒的视频。

  • 高质量视觉数据和字幕训练:通过使用更高质量的视觉数据和字幕进行训练,模型对世界运作的理解得到了增强。

  • CausalVideoVAE架构优化:对CausalVideoVAE架构进行了优化,这不仅提升了视频生成的性能,还提高了推理效率。

  • 与Sora基础模型性能相似:实验结果显示,v1.1.0版本的性能与Sora基础模型相似,这证明了版本演化与Sora所展示的缩放定律的一致性。

新版本的开源释放对社区的视频生成发展具有重要意义。开源的代码、数据和模型为社区提供了方便的后续开发条件。

官方项目页介绍了对CausalVideoVAE的一系列改进,包括模型结构的优化和推理技巧的引入,进一步提升了模型的性能和效率。

Open-Sora-Plan v1.1.0的这些更新和改进,展示了视频生成技术在理解力、性能和效率方面的持续进步,同时也为未来的研究和开发奠定了基础。

项目地址:https://top.aibase.com/tool/open-sora-plan-v1-1-0

在线体验地址:https://huggingface.co/spaces/LanguageBind/Open-Sora-Plan-v1.1.0

举报

  • 相关推荐
  • 即梦VS可灵,谁能「对标」Sora2?

    AI视频的战争,才刚刚开始。 在生成式AI的大航海时代,文字、图像、代码的疆界已相继被重绘,唯独“视频”这一最复杂、最昂贵、最具传播势能的内容形态,始终处在被技术反复叩门却未彻底攻陷的高地。 这个局面,似乎终于要被OpenAI在10月1日推出的Sora2而改变。

  • Sora2之后,又来了个全新的影视级AI视频模型,它的名字,叫GAGA。

    ​Sora2爆火之后,随之而来的AI视频领域的新产品。 来自我的好朋友,曹越老师的Sand.ai。 凌晨,他们终于上线了他们全新的音画同步视频模型GAGA-1,在人物表演上,我觉得,已经算是现在的TOP级了。

  • AI日报:LiblibAI 2.0正式上线;通义千问、豆包开启记忆功能;Sora已登陆Google Play

    本期AI日报聚焦多项重要进展:LiblibAI 2.0上线,内置多模型并提供限时免费算力;通义千问和豆包开启记忆功能内测;OpenAI视频生成应用Sora登陆Google Play并开放北美预注册;Qoder推出提示词增强功能提升开发效率;Cherry Studio集成主流AI模型并推出优惠活动;港中文团队推出首个结构化图像生成系统;DeepSeek入选2025全球十大工程成就。这些突破展示了AI技术快速迭代与多领域应用�

  • Sora 2生成已故名人视频引亲属不满 OpenAI回应:重视反馈 将迅速纠正失误

    OpenAI 近日推出的 Sora 2 模型引发广泛关注,其默认禁止生成在世公众人物视频,用户纷纷尝试生成各类创意内容。然而,创作者与观众很快发现这一限制存在明显漏洞该模型允许生成已故公众人物的影像,从而在伦理层面引发争议。 社交媒体上已涌现大量AI复活”名人的案例,例如李小龙主持DJ现场、迈克尔杰克逊表演单口喜剧等。尽管OpenAI在每段生成视频上添加动态水印,�

  • AI日报:谷歌发布Veo 3.1;通义千问推Qwen Chat Memory功能;Sora2免费用户可生成15秒视频

    本期AI日报聚焦多项技术更新:谷歌Veo 3.1视频模型新增音频生成与精细化编辑功能;通义千问推出记忆功能提升对话连贯性;Sora2免费用户可生成15秒视频,Pro版支持25秒;百度文心助手升级8种创作模式;谷歌Flow工具增强视频光影编辑与音频合成能力;Anthropic发布高性价比Claude Haiku 4.5;北京查处首例AI虚假广告案,涉伪造主持人带货;阿里推出响应仅200毫秒的编程工具Qoder CLI。

  • 最新版国内直连Sora2,无水印免费使用教程

    OpenAI推出的Sora2视频生成模型引发全球关注,其文字理解能力显著提升,仅需输入提示词即可生成带原生配音的完整视频,覆盖短视频、广告、影视等多场景。然而官方渠道存在水印且需付费,国内用户难以体验。文章推荐通过浏览器插件DeepSider免费使用Sora2,支持中文注册、无限制登录,可控制画面比例、无水印保存。该插件还集成Claude、Gemini等数十款AI模型,具备文档解析�

  • AI日报:Veo 3.1可生成1分钟视频;蚂蚁发布万亿参数语言模型 Ling-1T;Lovart可免费玩Sora2

    本期AI日报聚焦多项技术突破:Veo 3.1视频生成模型实现角色一致性与多场景叙事升级;蚂蚁发布万亿参数Ling-1T语言模型,推理能力领跑行业;xAI推出电影级视频生成模型Imagine v0.9;软银斥资53.75亿美元收购ABB机器人业务布局物理AI;Vercel v0新增图像编辑功能简化设计流程;OpenAI Sora2首日安装量飙升至应用商店第三,同时引发深度伪造伦理担忧;Lovart平台限时免费开放Sora2无水印视频生成;ChatGPT推出应用生态,正式升级为多功能服务平台。

  • 趣方屏+AI影像,nova Flip S解锁年轻生活新方式

    2025年10月17日,华为nova Flip+S折叠屏手机正式发布并开启预售,10月24日全渠道开售。该机主打潮流设计与趣味交互,配备1:1“趣方屏”外屏,新增天青蓝、羽砂黑配色,展开厚度仅6.88mm,通过120万次折叠认证。功能上支持通话趣显、外屏互动游戏、实时信息显示及AI助手等,搭载5000万像素主摄与3200万前置镜头,HarmonyOS 5.1系统性能提升15.5%。内置4400mAh电池与66W快充,预购享100元优惠及分期免息,用户还可获赠价值超800元的“鸿蒙有礼”会员权益。

  • 对话逗逗AI:猛涨千万用户背后,不抢屏幕时间,不做超级app,也不止于游戏了

    ​当你在游戏里卡关半小时,烦躁地想切出去搜攻略;或者在开放世界里孤独“跑图”,无聊到只能听歌的时候,如果这屏幕上突然冒出一个“小可爱”,一边帮你找路,一边陪你吐槽,感觉会如何? 这就是逗逗AI正在做的事。它不是一个需要你切换点开的APP,而是一个以虚拟形象或悬浮球形式,能看到你的游戏界面,听到你的声音,和你随时互动的AI玩伴。 我们来看一个顶

  • 打破应用孤岛——个推AI SDK全面接入MCP全场景能力

    大模型技术正推动产业从移动互联网向智能互联网跃迁,用户需求转向场景化、主动化、闭环化的智能体验。个推推出行业首个AI+SDK,集成自然语言交互、上下文理解、行业知识库等能力,帮助APP一键集成AI功能,降低开发成本。通过智能搜索、跨应用服务协同(MCP)等,实现从"字面匹配"到"意图识别"的升级,为用户提供精准服务。该方案已接入AI协同应用创新平台,支持多行业快速构建专业可信的智能应用生态。

今日大家都在搜的词: