首页 > 传媒 > 关键词  > OpenAI最新资讯  > 正文

成都汇阳投资关于Sora 正式上线,多模态模型的里程碑

2024-12-16 14:40 · 稿源: 站长之家用户

 事 件

  12 月 10 日,OpenAl正式上线 Sora,并向包括美国在内的多数国家用户开放,用户可在OpenAI官网上体验Sora。同时,Sora 被包含在ChatGPT Plus 和ChatGPT Pro 的会员订阅方案中, 用户无需额外付费。 其中,订阅Plus方案的用户可使用 Sora 生成最多 50 个分辨率达720p、时长为 5 秒的高 级视频而Pro方案能生成最多 500 个分辨率达1080p、时长为 20 秒的高 级视频,并且提供去水印功能。

新 Sora 视频再创作能力大幅提升

 相较于 OpenAI2 月份发布的版本, 此次上线的新 Sora 新增 Storyboard、Remix、Re-cut 等功能 ,视频再创作能力大幅提升 ,并且优化了视频生成速度及生成方式。新 Sora 的新功能包括 1)Storyboard:类似于电影里的分镜,即用户只需借助文字设计几段视频帧或直接上传图片作为静态视频帧, 并在视频帧之间预留一些时间供Sora 发挥,Sora 便能自动把这些视频帧串联起来形成一段完整的视频:2)Remix:通过不同的文字描述对视频中的元素进行替换、删除或重构, 比如可以把图书馆变成宇宙飞船:3)Re-cut:智能识别并剪切出视频中的最 佳帧,并将其导入 Storyboard 中 ,拓展该视频帧:4)Loop:用于创建无限循环的视频:5)Blend:将两个视频无合并为一个视频:6)Style presets:为视频预设风格 , 比如黑白电影、纸片人等。 此外,借助 Sora Turbo,新Sora 的视频生成速度显著提升, 同时,新 Sora 将视频生成方式扩展为文/文+图/文+视频生成视频。

 国内企业开始加速研发并选代A I 视频生成产品

 今年以来 , 国内企业开始加速研发并选代 AI 视频生成产品 ,产品能力不断提升 ,应用场景持续拓宽。1)今年 6 月,快手 AI 团 队发布可灵 AI 视频生成大模型 ,可生成长达 2 分钟 、分辨率达 1080p 的视频 ,可灵 AI 主要功能包括文生视频 、 图生视频 、 视频续写等;2)今年 7 月 ,智谱 AI 上线视频生成产品智谱清影 ,并在 11 月 进行全新升级 ,支持生成时长为 10 秒的 4K 超高清视频 ,除常规的文生视频和图生视频功能外 ,智谱清影引 入 CogSound 模型 , 可以对为 生成的视频添加背景音乐:3)今年 8 月 , 字节推出即梦 AI 一站式创作平台, 随后在 11 月 宣布即梦 AI 两大视频模型 S2.0 Pro 和 P2.0 Pro 正式全量上线,其中, S2.0Pro 在图生视频场景具有较高的首一致性,能够保持视频与用户输入图像的 色彩 、 风格等保持一致 ,P2.0Pro 具有极 高提示词遵循能力, 能够在一句提示词内实现多个镜头切换及多镜头组合, 同时保持视频内形象主体、 风格和氛围的一致性 。此外 ,Minimax、 阿里云等初创企业及大模型厂商也在布局 AI 视频生成赛道, 整体来看,视频生成工具今年以来, 国内企业开始加速研发并选代 AI 视频生成产品,产品能力不断提升 ,应用场景持续拓宽 。 1)今年 6 月 ,快手 AI 团队发布可灵 AI 视频生成大模型, 可生成长达 2 分钟、分辨率达 1080p 的视频,可灵 AI 主要功能包括文生视频、 图生视频、 视频续写等;2)今年  7 月,智谱AI 上线视频生成产品智谱清影 ,并在11 月进行全新升级 ,支持生成时长为 10 秒的 4K 超高清视频 , 除常规的文生视频和图生视频功能外,智谱清影引 入 CogSound 模型 , 可以对为生成的视频添加背景音乐:3)今年 8 月, 字节推出即梦AI 一站式创作平台, 随后在 11 月宣布即梦 AI 两大视频模型 S2.0 Pro 和 P2.0 Pro 正式全量上线 , 其中 ,S2.0Pro 在图生视频场景具有较高的首一致性 , 能够保持视频与用户输入图像的色彩 、 风格等保持一致 ,P2.0Pro 具有极 高提示词遵循能力, 能够在一句提示词内实现多个镜头切换及多镜头组合 , 同时保持视频内形象主体、风格和氛围的一致性。此外 ,Minimax、 阿里云等初创企业及大模型厂商也在布局 AI 视频生成赛道 , 整体来看 ,视频生成工具的能力不断提升 , 未来有望渗透更多应用场景。

相关公司

 三六零 (601360) : 目前 360 搜索是中国搜索引擎的 Top2 , 市场份额为 35%,公司的人工智能研究院从 2020 年开始一直在包括类 ChatGPT 技术在内的 AIGC 技术上有持续性的投入 ,但截至目前仅作为内部业务自用的生产力工具使用 ,且投资规模及技术水平与当前的 ChatGPT3 相比还有较大差距 , 各项技术指标只能做到略强于 ChatGPT2 。 由于训练数据源及应用方向的原因 ,在中文环境下的实际效果强于 ChatGPT2 。360 在数据资源端有丰富的多模态大数据积累和相关语料 、尤其是中文语料 ,相较于国外同行落后的是预训练大模型和有效的多模态数据清洗与融合技术 。公司有充足的资金储备可用于购买大规模算力 ,在继续深入自行研发的同时 ,不排除寻找强有力的合作伙伴 , 以开放的心态搭建多方共享平台 、补足短板 ,快速缩小差距 。公司也计划尽快推出类 ChatGPT 技 术的 demo 版产品 。

 中科曙光 (603019):伴随宁夏 “ 算力交 易平台 ” 的上线 , “ 东数西算 ” 工程迎来重要里程碑 。 2 月 24 日 ,由宁夏回族自治区联合中科曙光 、中国电信宁夏公司 、北京国际大数据交易所等打造的国内头个一体化算力交易调度平台——东数西算一体化算力服务平台正式上线 。该平台上线后将整合宁夏地区零散算力资源 ,解决算力输出、应用 、交易等难题 ,赋能宁夏“ 六新六 特 ”等产业数字转型升级。

 参考资料:20241212- 山西证券-计算机行业点评: Sora正式上线, 多模态模型的里程碑

 免责声明:以上信息出自汇阳研究部,内容不做具体操作指导,客户亦不应将其作为投资决策的唯 一参考因素。据此买入,责任自负,股市有风险,投资需谨慎。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • AI日报:快手推出AI视频制作助手Kwali;字节跳动推出USO模型;OpenAI推出ChatGPT开发者模式

    本文介绍了AI日报栏目,聚焦AI领域最新动态。快手推出Kwali视频助手,简化视频制作流程;字节跳动发布USO模型,解决图像生成中风格与主题的矛盾;微软推出Copilot Audio音频模式,提供个性化语音交互;Stability AI升级Stable Audio 2.5,支持高质量音频生成;阿联酋推出开源大模型K2 Think,拥有320亿参数;微信上线智能回复功能,提升公众号运营效率;OpenAI推出ChatGPT开发者模式,支持AI控制外部工具;字节跳动Seed团队发布AgentGym-RL框架,提升语言模型决策能力;月之暗面开源Checkpoint Engine中间件,优化LLM推理效率;B站开源IndexTTS-2.0文本转语音系统,支持情感与时长控制;Replit推出Agent 3编程助手,自主性提升10倍。

  • 基于通义万相 美图多款APP上线全新动漫特效、AI变身等视频生成功能

    今日,美图公司旗下美图秀秀、RoboNeo、Wink和开拍等多款产品,推出全新动漫特效、AI变身等视频生成功能。 据悉,新功能基于通义万相系列模型进行深度开发与训练,为美图的全球用户提供全新的创作体验。 近年来,美图加速布局生产力场景,不仅推出面向企业的AI算法服务和解决方案,旗下消费级产品也在快速集成大模型。 去年6月,美图就开始和阿里展开大模型合作。

  • AI日报:苹果明年推出SiriAI搜索;OpenAI放开ChatGPT Projects功能;Kimi K2-0905 上线 Discord

    本文汇总了AI领域最新动态:苹果与谷歌合作,计划在Siri中引入Gemini AI技术;OpenAI向免费用户开放Projects功能,提升任务管理效率;谷歌推出免费Gemini CLI工具,集成GitHub提升开发效率;OpenAI估值飙升至5000亿美元,二级股票售出103亿美元;苹果自研AI搜索引擎“世界知识问答”计划2026年上线;月之暗面发布Kimi K2-0905模型,提升编程与创意写作能力;Raycast推出Cursor Agent插件优化代码编辑;谷歌发布nano banana官方Prompt模板,助力创意设计。

  • OPPO Watch S官宣:轻薄表皇

    OPPO宣布将于10月16日推出OPPO Watch S智能手表,主打“轻薄表皇”设计,厚度不足9mm,号称目前市面上最薄的智能圆表。搭载全新智能手表系统,操作体验媲美手机,健康配置亦有惊喜。同时具备“健身教练”功能,可自动识别运动并提供超100种运动模式,专业记录数据。此外,发布会还将推出OPPO Find X9和X9 Pro旗舰手机,首批搭载联发科天玑9500平台,出厂预装全新ColorOS 16系统。

  • OpenAI发布GPT-5-Codex:可完成7小时单次编程任务

    OpenAI宣布推出新一代AI编程模型GPT-5-Codex,其最大亮点是创新的动态时间分配系统。 不同于传统AI追求秒级响应”,该模型可根据任务复杂度灵活调整处理时长,从数秒到7小时不等,以更接近人类专家的决策方式优化代码质量。 GPT-5-Codex产品负责人亚历山大恩比里科斯解释称,传统模型在任务初期即固定计算资源,而GPT-5-Codex能实时评估需求:动态决定加速推进、暂停语法核�

  • 当视频播客陷入“形式之争”,成就UP主才是真正的增量

    随着B站推出“视频播客出圈计划”,抖音、小红书等平台相继加码,名人效应与资源倾斜不断助推着这一内容形态站上风口。与此同时,质疑也随之而来,“播客视频化是否只是一个伪命题?”“到底是视频播客化还是播客视频化?”等议论愈演愈烈。 而在这些争论之外,一个更值得思考的议题正在浮现:当公众在讨论视频播客的概念是否成立时,行业能否借此机会跳出形式之�

  • 苹果Apple Watch高血压通知功能上线

    苹果公司宣布将在全球150多个市场推出Apple Watch高血压通知功能,该功能将随watchOS 26和iOS 26系统更新正式推送。目前英国、法国、德国等地区用户已可体验,但加拿大等部分市场尚未开放,中国大陆地区仍需等待监管审批。该功能依托光学心率传感器,可实时监测用户血管对心跳的反应,识别慢性高血压迹象,并在检测到异常时发出提醒。系统会分析用户最近30天的数据,通过先进算法判断是否需要发出通知。

  • 小米发布17 Pro/Pro Max「妙享背屏」功能演示视频

    今日小米官方又晒出了小米17Pro/Pro Max上背屏功能的精彩演示。 小米17Pro/Pro Max所搭载的这块背屏尺寸颇大,正因如此,其展示内容极为丰富。从各种风格的时间样式,到灵动鲜活的动态壁纸,再到可爱的卡通人物与动物形象,一应俱全。 不仅如此,它还具备无限屏模式,预计还能实现自定义显示图片、动图等效果,与小折叠设备上的背屏用途基本一致。用户可借助徕卡三摄�

  • StarRocks Connect 2025 圆满落幕:AI Native 时代,数据分析未来已来

    StarRocks Connect 2025峰会圆满落幕,聚焦AI Native时代的数据分析未来。活动汇聚全球开发者与行业专家,分享StarRocks在复杂业务场景中的实践,探讨技术演进方向。从性能引擎到AI原生平台,StarRocks 4.0将支持多智能体协作框架,提升数据分析效率。多家企业展示应用案例,覆盖电商、金融、旅游等领域,验证了其高性能与成本优势。开源精神推动技术创新,共同探索数据智能的无限可能。

  • 天网杯纳米AI视频创作赛圆满落幕,ISC.AI学苑推动“教育AI+”新范式

    9月23日,第三届“天网杯”网络安全大赛在天津落幕,吸引全国顶尖战队角逐,同期举办纳米AI视频创作赛。赛事聚焦个人信息保护、防诈 骗等网络安全议题,通过“以赛促学”模式提升学生防护意识与AI应用能力。ISC.AI学苑作为平台支持,依托“纳米AI”技术降低创作门槛,推动“安全+AI”人才培养。大赛评选出24个奖项,并联合多所高校深化合作,促进AI技术在教育场景的落

今日大家都在搜的词: