首页 > 业界 > 关键词  > Adobe最新资讯  > 正文

Adobe 发布 VideoGigaGAN 超分辨率视频模型

2024-06-04 08:46 · 稿源:站长之家

划重点:

Adobe 和研究人员合作推出 VideoGigaGAN,兼顾帧率连贯性和细节丰富的超分辨率视频模型。

⭐ VideoGigaGAN 基于 GigaGAN 模型开发,通过添加时序卷积、自注意力层和光流引导模块,解决了超分辨率视频模型的时间连贯性和细节丰富性问题。

⭐ VideoGigaGAN 模型利用时序卷积捕捉视频帧之间的时间依赖性,自注意力层提取空间细节和纹理信息,光流引导模块保持特征的空间一致性,从而生成清晰的超分辨率视频。

站长之家(ChinaZ.com)6月4日 消息:全球多媒体巨头 Adobe 与马里兰大学的研究人员合作推出了新的超分辨率视频模型 VideoGigaGAN。该模型兼顾帧率连贯性和丰富细节,解决了当前超分辨率视频模型的难题。

微信截图_20240604084554.png

在过去的超分辨率视频转换中,存在两大难题:一是保持输出视频帧在时间上的连贯性,确保帧到帧之间平滑过渡,不出现闪烁或抖动的情况;二是在放大的视频帧中重建高频细节,提供清晰和逼真的纹理效果。然而,目前的超分辨率视频模型虽然在保持时间连贯性方面取得了进展,但以牺牲图像清晰度为代价,整体模糊缺乏更加生动的细节和纹理。

VideoGigaGAN 是基于 Adobe、卡内基梅隆大学和浦项科技大学之前推出的大规模图像超分辨率模型 GigaGAN 的基础之上开发而成。该模型通过添加时序卷积和自注意力层,将 GigaGAN 模型从2D 图像扩展为3D 视频模型,同时引入了光流引导模块,更好地对齐不同帧的特征,提高视频的时间一致性和细节丰富性。

时序卷积模块使模型能够捕捉视频帧之间的时间依赖性,从而提高超分辨率视频的时间一致性。自注意力层在解码器块中提取空间上的细节和纹理信息,同时在时间上增强一致性。光流引导模块利用光流来预测视频帧中的像素级运动,保持特征的空间一致性,生成清晰的超分辨率视频。

VideoGigaGAN 的技术原理:

基于 GigaGAN:VideoGigaGAN 基于大规模图像超分辨率模型 GigaGAN,通过将其扩展为视频模型来实现视频超分辨率处理。

时域注意力:在解码器块中添加时域注意力层,以确保在视频超分辨率处理过程中保持时域一致性。

特征传播模块:利用特征传播模块来增强一致性,将特征从视频的不同帧之间进行传播,以保持视频的连贯性。

抗锯齿处理:通过在编码器的下采样层中引入抗锯齿模块,有效抑制视频中的锯齿状伪影,改善视觉效果。

细节补偿:通过直接将高频特征通过跳跃连接传输到解码器层,以补偿在模糊处理过程中丢失的细节。

通过以上技术原理,VideoGigaGAN 能够在视频超分辨率处理中实现高质量的细节丰富的输出,并保持时域一致性。

VideoGigaGAN 具有以下功能特点:

视频超分辨率:能够将低分辨率的视频提升至高分辨率,增加视频细节和清晰度。

时域一致性:在进行视频超分辨率处理时,能够保持视频的时域一致性,避免出现时间上的不连续或跳跃。

丰富的细节处理:能够处理视频中的丰富细节,包括纹理、边缘和高频信息,提升视频质量。

抗锯齿处理:能够有效抑制视频中出现的锯齿状伪影,改善视频的视觉效果。

通用性:能够处理不同类型的视频内容,适用于多种视频处理场景。

高质量输出:生成的超分辨率视频具有更高的质量和清晰度,可用于多种应用领域。

VideoGigaGAN 可以在多种应用场景中发挥作用,包括但不限于:

1. 视频内容制作:提高视频内容的清晰度和细节,使得视频制作过程中可以处理低分辨率素材,并生成更高质量的视频作品。

2. 视频监控和安全领域:对于监控摄像头捕捉的低分辨率视频进行超分辨率处理,从而提高监控系统的效能和识别能力。

3. 视频通讯和会议:在视频通话和远程会议中,对低分辨率视频进行提升,改善视频质量,提升用户体验。

4. 医疗影像:对于医学图像和视频进行超分辨率处理,提高医疗影像的清晰度和诊断准确性。

5. 视频内容分发:对于在线视频平台或内容提供商,可以使用 VideoGigaGAN 提高视频质量,提供更清晰的视频内容给用户。

产品入口:https://top.aibase.com/tool/videogigagan

举报

  • 相关推荐
  • 投影选择终极答案:Vidda 618 销额 TOP1,买投影就选它

    Vidda在618大促首波销售中凭借卓越产品力与用户口碑,拿下投影品类全行业销售额TOP1,印证其智能投影市场领先地位。这源于消费者对极致视听体验的追求及Vidda在激光显示领域的技术深耕。作为三色激光投影定义者,Vidda以用户需求为核心,通过硬核技术与创新体验,将高端影院级视听带入千家万户。近期发布C5 Master、C5 Ultra Max等全矩阵新品,从家用高端旗舰到便携户外场景深度布局,以跨代AI计算影像技术与硬件革新,重新定义行业标准,满足不同用户需求,推动智能投影体验升级。

  • Vidda投影全矩阵新品重磅发布 引领三色激光进入AI计算影像新时代

    5月8日,以“有态度 就登场”为主题的海信& Vidda全场景新品发布会正式举行。Vidda智能投影携5款重磅新品集中亮相,涵盖C5Master、C5UltraMax、C5Ultra、C5ProMax四大旗舰机型,以及户外专属的LightGo流光派,不仅完成了从家用高端旗舰到便携户外场景的全赛道深度布局,更以跨代级的AI计算影像技术与硬件革新,重新定义三色激光投影的行业标准。价格方面,C5Master首发限时补贴到手�

  • iSlide 上线 macOS 插件版,进一步完善 AI 时代的 PPT 制作体验

    iSlide推出macOS插件版,直接嵌入PowerPoint,实现AI生成PPT、模板资源、图示图表及设计排版等功能的原生融合。这解决了Mac用户需在多个工具间切换的痛点,提供从内容生成到视觉呈现的一体化高效工作流,覆盖模板、图示、图片等核心资源场景,并配备矩阵布局等设计工具,显著提升PPT制作效率与专业度。

  • 腾讯云TVP走进银河通用×NVIDIA×福田戴姆勒,解码AI驱动产业硬核突围之路

    腾讯云TVP于4月24-25日举办“硬核突围 智见未来”活动,首创“两天三站”模式,带领70+行业领袖走进银河通用机器人、NVIDIA和福田戴姆勒汽车。活动聚焦具身智能产业化、Agent发展趋势和企业AI转型,通过参观、分享、圆桌论坛等形式,探讨AI驱动硬科技产业进化的核心路径,强调数据、算法、硬件深度协同的产业变革正在发生。

  • 有态度,就登场!海信&Vidda如何跟年轻人玩在一起?

    海信不再只是电视品牌,而是突破客厅场景,进军全场景生活。五四青年节之际,海信&Vidda发布“有态度,就登场”预热视频,展示AI音频眼镜、画框音箱、3A原画显示器等新品,融合年轻人社交、创作、娱乐场景,强调技术立企,抓住年轻人心。5月8日14:30,全场景新品发布会将解锁更多潮流产品,颠覆传统3C体验。

  • AI日报:Kimi K3将于第三季度推出;英伟达发布多模态“全能模型”;Claude深度集成Adobe、Blender

    本期AI日报聚焦八大热点:月之暗面将推2.5万亿参数Kimi K3大模型,长文本处理能力突破;英伟达发布多模态模型Nemotron-3 Nano Omni,推理效率提升9倍;蚂蚁集团开源百灵Ling-2.6-flash模型;商汤推出原生多模态统一模型SenseNova U1;Claude深度集成Adobe等八大软件;字节TRAE SOLO上线语音输入;科大讯飞发布星火X2-Flash模型;ima上线知识Agent copilot,内置记忆系统。

  • 风波过后,长视频究竟在用AI做什么

    ​5月6日杨洋新剧《雨霖铃》的看片会上,谈及打戏,制片人侯鸿亮说:“在今天这个AI时代,恐怕也是最后一次这样手搓了。”正午阳光的第一部武侠剧,说出了最后一部的气魄,“手搓武侠”果然成为《雨霖铃》传播最广的标签。 经过整个4月影视行业对AI的激情鼓吹,大众的逆反情绪也确实该走到了反向造神环节。5月伊始,“手搓红利”显现。不管是民间自制的手搓爆款《

  • 扒了上百条AI爆款视频,我们得出了6点观察

    ​在社交媒体上刷到一条标注着“内容由AI生成”的视频,这件事正变得越来越常见。 无论是AI玩梗视频,还是走影视级路线的AI短片,又或是在原内容中注入各类AI元素的博主账号,可以说,AI正在重塑一部分内容生态。不久前,AI视频领域还出现了《纸手机》这样的现象级出圈之作。

  • AI日报:快手拟分拆可灵AI独立融资;360升级“安全龙虾”平台;网信办要求AI生成视频必须标注

    快手拟分拆可灵AI独立融资,估值200亿美元剑指明年IPO,其年化营收已破3亿美元,覆盖C端订阅与B端API调用,全球创作者超6000万。网信办发布短视频标注新规,要求平台为AI生成及虚构内容提供六类必选标签,强化存量视频追溯补标,推动产业合规。小米自研大模型MiMo获国际认可,百度发布Ernie5.1预训练成本骤降94%,性能挺进全球Search排行前四。360升级“安全龙虾”平台,10分钟可自建专家智能体;Claude Code推出Agent View统管后台AI任务。宇树科技发布全球首款量产载人变形机甲GD01,起售价390万元。谷歌地图深度集成Gemini,CarPlay导航将进入对话时代。

  • 三星首款阔折叠手机!Galaxy Z Fold 8 Wide影像规格揭晓

    三星首款阔折叠预计命名为Galaxy Z Fold 8 Wide,将于7月发布,抢先iPhone Fold亮相。 根据最新爆料,该机将搭载后置双摄方案,分别为50万像素f/1.8广角主摄与50万像素f/1.9超广角镜头,两枚镜头均支持自动对焦与8K 30fps视频录制,取消长焦。 作为对比,标准版Galaxy Z Fold 8将沿用2亿像素主摄方案,并保留独立长焦镜头,形成后置三摄系统。 整体来看,Galaxy Z Fold 8Wide在影像方面有所

今日大家都在搜的词: