首页 > AI头条  > 正文

震撼来袭!Open-Sora Plan v1.2发布,清晰度、推理速度起飞

2024-07-25 09:26 · 来源: AIbase基地

Open-Sora Plan又升级了!最新发布的Open-Sora Plan v1.2版本引入新的3D全注意力架构,提升了对物理世界的理解能力。

本次更新主要亮点:

全新3D全注意力架构:新架构让AI对物理世界的理解能力有了质的飞跃。不再是只会平面思考的"二维码",现在它能360度无死角理解这个立体世界啦!

文本生成视频能力升级:你敲下一段文字,AI就能为你呈现出栩栩如生的视频画面。

清晰度和一致性双双提升:通过新架构和优化的VAE结构,Open-Sora生成的视频画质更清晰,内容更连贯。告别模糊不清!

空间与时间的完美融合:新的3D全注意力架构解决了之前版本的一大难题——同时处理空间和时间维度。这意味着什么?意味着生成的视频在空间表现和时间流畅度上都将有显著提升!

推理速度大幅提升:优化后的CausalVideoVAE结构不仅提高了模型的性能,还让推理速度快得飞起。效率党们欢呼吧!

image.png

回顾一下Open-Sora的发展历程,我们会发现它的进步速度令人惊叹。就在2024年5月,v1.1.0版本还在使用2+1D模型架构,主要用于探索性训练。而现在,短短几个月后,它就进化成了能创造3D世界的"造物主"!这速度,怕是连达尔文看了都要惊呼:"进化论要改写啦!"

最帅的是,Open-Sora团队不藏私!代码、数据、模型统统开源,就差把"如何创造世界"的说明书贴你脸上了。他们的目标很简单:让每个人都能成为视频创作的"上帝"!这种开放共享的态度,无疑会加速AI视频生成技术的进步。

Open-Sora Plan v1.2.0的发布标志着视频生成模型迈入了一个新的时代。它不仅在视觉表示压缩和推理效率上有了显著提升,更为未来的发展指明了方向。

项目地址:https://top.aibase.com/tool/open-sora-plan-v1-2

  • 相关推荐
  • 全球销量增20%,份额净增1.2pct!海尔空调郑州发布新成果

    今年空调市场受高温和政策刺激持续火热,但行业面临流量枯竭、内卷和高成本挑战。海尔空调实现销量与销售额双增长,安装量增长超50%,线上线下份额均提升。其高端空气解决方案品牌卡萨帝收入增长超50%,空气类产品销量激增120%。海尔发布三大突破性成果,推出"性能神机"云溪空调,解决极端高温制冷和冬季制热难题,APF值达6.03,省电40.3%。同时发布行业首个AI空调团体标准,定义真智能界限。海尔还推出"一机三系统"方案,整合制冷、新风和湿度调节功能,以及"8小时极速换新"服务承诺,重新定义家庭舒适呼吸体验。

  • 首款触控式投影震撼来袭:三星Premiere 5让指尖轻触开启智慧生活新次元

    三星推出首款搭载三色激光与触控交互功能的Premiere5投影仪,实现43.3厘米超短距投射100英寸画面。创新融合红外摄像头与激光技术,支持指尖操控投影画面,打破传统遥控器局限。配备154% DCI-P3广色域和杜比全景声,带来影院级视听体验。内置Tizen智能系统,支持SmartThings APP联动智能家居,可一键切换桌面/墙面/地板投影模式。磁吸式支架设计实现快速安装,环境光自适应技术确保画面清晰。该产品重新定义家用投影交互方式,满足家庭娱乐、商务会议等多场景需求。

  • 百利好:清晰视界 守护光明

    文章聚焦全球儿童视力健康问题,指出目前全球约140万儿童失明、700万视力低下,中国视力障碍儿童占比1.56%。视力问题严重影响儿童身心发展,给家庭和社会带来沉重负担。百利好慈善基金会与奥比斯合作推出为期三年的"中国儿童综合眼部健康计划",重点包括:加强县级儿童眼科服务,优化眼健康转诊网络,推广全面眼保健。计划将通过设备支持、技术培训、健康教育等方式,提升基层医疗能力,重点关注农村地区儿童视力健康。自1982年以来,奥比斯已帮助数万名患者恢复视力。该计划旨在实现"让每个孩子看清世界"的愿景,需要社会各界共同关注与支持。

  • AI日报:GPT-5正式发布;百度将推文心5.0大模型;知网发布AIKBase V2.0多模态数据管理系统

    《AI日报》精选AI领域最新动态:1)OpenAI发布GPT-5模型,具备强大多模态能力但推理任务仍有局限;2)知网推出AIKBase V2.0多模态数据管理系统;3)Ideogram新增"角色"功能实现图像风格统一;4)Cursor发布CLI版本支持终端AI编程;5)百度即将推出全新推理模型和文心5.0大模型;6)dots.ocr推出1.7B参数多语言文档解析工具;7)特斯拉解散Dojo超算团队转向英伟达合作;8)谷歌Pixel 10引入AI相�

  • AI日报:百度推全球首批AI数字员工;Claude Opus4.1出世;谷歌DeepMind发布世界模型Genie 3

    AI日报栏目聚焦人工智能领域最新动态:1)Claude Opus4.1发布,编程能力提升74.5%;2)OpenAI开源GPT-OSS-120B和20B模型;3)谷歌DeepMind推出革命性3D世界模型Genie3;4)谷歌Gemini新增AI故事书生成功能;5)ElevenLabs推出商用AI音乐生成器;6)百度智能云发布首批AI数字员工;7)OpenAI估值或达5000亿美元;8)00后创业者推出云端AI协作开发工具Vinsoo;9)腾讯启动2026校园招聘,重点培养AI人才;10)马斯克宣�

  • 雷蛇发布幻影战狼V3专业版8K PC专用——专为竞技PC玩家打造的专业无线电竞手柄

    雷蛇发布幻影战狼V3专业版8K+PC专用电竞手柄,专为竞技PC玩家打造。该手柄搭载8000Hz轮询率技术、抗漂移TMR摇杆和轻量化无线设计,提供极致速度和精准度。专业版售价1499元,竞技版799元。产品特点包括:可更换摇杆帽、机械触感按键、8向方向键,支持雷云4软件深度自定义。雷蛇表示这是专为PC生态系统打造的专业级手柄,满足电竞选手和硬核玩家对零延迟操控的需求。

  • 乘势焕新|V6家居2025秋季新品发布会暨经销商大会启幕全民焕新家时代

    V6家居举办2025秋季新品发布会,推出沙发、床垫等系列新品,主打"高颜值、高品质、高舒适度"设计理念。同时携手央视网启动国家级IP项目《全民焕新家》,通过"一站购新家"模式降低消费门槛。活动汇聚慕思集团高层及行业专家,探讨大家居行业趋势。品牌强调"自主研产销"一体化优势,并推出"空-炮-巷"三位一体营销模型,构建精准零售体系。现场多位经销商分享实战经验,展示终端创新案例。V6家居总经理江涛表示,将持续深化产品力与服务力,携手合作伙伴共同推动国民家居品质升级。

  • 荣耀Magic V Flip2 定档 8 月 21 日 外观配置亮点抢先看

    荣耀官方正式宣布,备受期待的荣耀Magic V Flip2将于8月21日重磅发布,与此同时,官宣海报也揭开了这款新品的神秘面纱,让大众得以一窥其外观设计。 在外观方面,荣耀Magic V Flip2延续了超大外屏方案。与前代“大小眼”的摄像头设计不同,此次新品改用了两颗相同大小的摄像头,整体视觉效果更加协调美观。前代产品的外屏尺寸就已近乎行业极限,在整体方案保持不变的情�

  • 可赶上这波了!iOS用户“一键补课”了Mistplay的新功能

    在2023 ChinaJoy展会上,Mistplay凭借其独特的"玩赚"模式成为BTOB展区热门平台。该平台通过游戏时长激励玩家,同时为开发者提供高质量用户,已覆盖全球九大应用市场,累计安装超3500万次。Mistplay近期推出iOS版本,新增锦标赛、益智问答等功能,并创新推出LoyaltyPlay功能,为非游戏应用搭建激励桥梁。其核心AI引擎"Helios"能精准匹配用户与游戏,提升用户留存率和LTV。中国区负责人彭超楠在展会上分享了"忠诚度营销"理念,为游戏出海提供新思路。双平台布局使Mistplay优势更加突出,成为开发者提升用户留存的重要合作伙伴。

  • RAZER发布黑寡妇蜘蛛 V4 矮轴超薄游戏键盘系列

    雷蛇发布黑寡妇蜘蛛V4矮轴超薄游戏键盘系列,包含极速版和竞技极速版两款产品。键盘采用全新矮轴机械轴体,触发键程仅1.2mm,配备Razer HyperSpeed无线技术,轮询率1000Hz,支持多设备连接。18.5mm超薄设计搭配人体工学倾斜角度,提供舒适输入体验。键盘采用5052铝合金上盖,内置消音泡棉,按键寿命达8000万次。配备多功能滚轮、专用宏按键和媒体控制键,内置电池续航最高980�

今日大家都在搜的词: