首页 > 业界 > 关键词  > Upscale-A-Video最新资讯  > 正文

南洋理工大学研究人员推出研究人员发布Upscale-A-Video:利用文本提示提升视频超分辨率

2023-12-18 16:53 · 稿源:站长之家

**划重点:**

1. 🌐 视频超分辨率面临多种挑战,NTU研究人员采用潜在扩散框架中的本地-全局时间一致性策略,通过文本提示引导纹理创作,实现真实细节的卓越提升。

2. 🔄 通过本地微调和全局潜在传播模块,研究团队解决了CNN模型在生成真实纹理方面的限制,提高了视频局部和整体结构的稳定性。

3. 🎥 研究结果展示Upscale-A-Video在超分辨率性能上表现卓越,通过对比人工智能生成和真实视频超分辨率,呈现出更高的视觉逼真度和更精细的细节。

站长之家(ChinaZ.com)12月18日 消息:近日,新加坡南洋理工大学(NTU)的研究人员成功发布了一项名为"Upscale-A-Video"的视频超分辨率技术,通过开创性的文本引导潜在扩散方法,旨在提升低质量视频的视觉质量。

视频超分辨率领域面临着在真实场景中常见的多样且复杂的降质问题,包括但不限于降采样、噪音、模糊、闪烁和视频压缩等因素。传统的基于卷积神经网络(CNN)的模型在缓解这些问题方面取得了一定进展,但由于生成能力有限,容易产生过度平滑的纹理,导致生成的视频缺乏真实感。

image.png

为了应对这些挑战,NTU的研究团队采用了本地-全局时间一致性策略,结合了潜在扩散框架。在本地层面,预训练的放大模型经过微调,集成了额外的时间层,包括3D卷积和时间注意力层,显著提高了本地序列的结构稳定性,减少了纹理闪烁等问题。同时,引入了一种新颖的流引导的递归潜在传播模块,以全局的方式进行操作,通过逐帧传播和潜在融合确保了较长视频的整体稳定性。

研究中探索了引入文本提示来引导纹理创建的创新方法,使模型能够生成更真实和高质量的细节。此外,通过向输入注入噪音,增强了模型对于重度或未知降级的鲁棒性,为恢复和生成之间的平衡提供了控制。较低的噪音水平优先考虑恢复能力,而较高水平则鼓励更精细的细节生成,实现了保真度和质量之间的权衡。

研究的主要贡献在于设计了一种强大的方法来解决真实场景视频超分辨率的问题,将本地-全局时间策略与潜在扩散框架相融合。通过引入时间一致性机制和对噪音水平和文本提示的创新控制,该模型在基准测试中表现出卓越的视觉逼真度和时间一致性。

NTU的研究不仅在技术上取得了显著进展,更为实现视频超分辨率的真实性和高质量提供了新的可能性。

举报

  • 相关推荐
  • 声画无界,年味同心:菁彩Vivid三度携手央视频,让前沿视听技术闪耀全球舞台

    2026年央视春晚将于2月16日晚8点播出,央视视频客户端将携手菁彩Vivid技术,为全球观众带来沉浸式视听体验。本次直播依托HDR Vivid和Audio Vivid技术,采用多机位8K超高清实时制作,结合智能算法动态优化画面亮度与色彩,呈现更真实的舞台细节和色彩层次。音频方面通过双链路方案,适配不同终端播放需求,实现环绕声和天空音效,带来身临其境的听觉感受。这不仅是一场视听盛宴,更是科技与艺术的融合,传递中华文化的温暖与力量。

  • 曲婉婷抖音新账号头像和ID清空 此前发布视频遭网友抵制

    2月22日消息 今日,有网友发现歌手曲婉婷在抖音开设个人账号,该账号身份认证为原创音乐人”,目前仅发布一条视频,粉丝数约1万,评论区已设置为仅作者可评”。该账号开通后引发网友抵制,有网友表示,这种人也能复出?”互联网是有记忆的。”随后不久,相关页面显示,该账号的ID和头像已清空,疑似遭到平台处理。据悉,此次曲婉婷开通账号并完成认证,该举动被解读为复出试水。该账号认证为原创音乐人”,IP属地显示为江苏,但曲婉婷曾公开表示自己身在加拿大且无法回国,引发代运营猜测。此外,该账号还迅速开启仅作者评论”功能并开通?

  • 17岁男生发现新物种筷子蛇 直接发SCI期刊封神

    近日,浙江临海一名17岁高三学生胡家豪,凭近夜间野外调查,发现爬行动物新物种 括苍山脊蛇(俗称 筷子蛇”),相关成果发表于国际期刊《Zoosystematics and Evolution》,拿下人生第一篇SCI。 这是20世纪以来,首个模式产地位于浙江的爬行动物新物种。胡家豪在朋友圈晒出论文截图后,这段 午夜寻蛇” 的经历引发关注。 据悉,在2025年暑假,课业间隙的胡家豪正式开启括苍山

  • 17岁男生发现新物种筷子蛇SCI发文:“刷山”40夜 科学梦成真

    浙江临海有个17岁的高三学生胡家豪,最近可是干出了一件让人竖起大拇指的大事!这小伙子凭着自己对科学的热爱和一股子倔强劲儿,在夜间野外调查了近半年,竟然发现了一种全新的爬行动物——括苍山脊蛇,大家都亲切地叫它“筷子蛇”。 胡家豪说,这“筷子蛇”身形纤细得跟筷子似的,体长也就30厘米左右,无毒无害,但基因跟近缘物种差异可大了去了。这可是20世纪�

  • 别让AI毁了四大名著 微信8000余条AI魔改视频下架

    谁能想到,在AI魔改下,关羽竟然能端起狙击枪,林黛玉也能倒拔垂杨柳。这些看起来有些抽象”甚至滑稽的画面,如今终于被清理了。 微信对此重拳出击,2026年以来已累计处置超8000条AI魔改违规视频,其中1月处置4376条,2月再处置3956条,坚决遏制经典内容被恶意篡改的乱象。 这些违规AI魔改内容乱象百出,不少创作者对《三国演义

  • 声画共舞启新程,2026央视春晚以菁彩Vivid铸就视听新标杆!

    2026年央视春晚在璀璨Vivid技术加持下圆满落幕。开场歌舞《马上有奇迹》以喜庆画面勾勒龙马精神;歌曲《立春》借婉转合唱与悠扬管弦,在三维声场中展现春日生机。全球亿万观众沉浸于这场视听盛宴,感受技术与艺术的交融。这是央视视频客户端连续第三年以璀璨Vivid技术直播春晚,该技术已从演播厅走向家庭、影院、车载座舱与城市公共屏幕,成为国民级视听基础设施。

  • 欧税通再获2.8亿元融资,由IDG领投,高成资本追投

    近日,欧税通完成2.8亿元战略增持,由IDG资本领投2.3亿元,老股东高成投资追加5000万元。融资资金将重点投入核心技术研发、全球服务网络升级及合规生态体系建设,加速全球化战略落地。作为领先的跨境电商合规服务商,欧税通凭借自主研发的智能合规SaaS平台,融合AI、大数据风控等技术,构建了覆盖财税、环境、产品认证等多维度的服务体系,业务已覆盖全球113个国家和地区。

  • 潮牌Supreme卖棺材 介绍称“耐用”:20号钢打造

    近日,潮流界再掀波澜,Supreme2026 春夏系列推出了一款极具话题性的“终极潮流单品”——Supreme/Titan Orion Casket(联名棺材),瞬间成为时尚圈和大众热议的焦点。 这款联名棺材是Supreme与美国殡葬用品品牌Titan Casket携手打造的。Titan Casket采用DTC模式,主打平价棺椁,此次合作款为美国制造,预计于 8 月正式发售。 从材质和设计来看,这款棺材颇具特色。它由 20 号钢材打造而

  • 演员王劲松遇自己AI视频直呼太可怕:完全看不出来真假

    昨日,知名演员王劲松在社交平台发文,称自己的形象被AI技术盗用生成视频,相关内容的声音、口型制作逼真,让人完全分辨不出真假。 发现自身权益受损后,王劲松第一时间进行维权,涉事视频已被删除。 但此次经历仍让王劲松心生诸多担忧,他表示:侵权者的代价可以忽略不计,不疼不痒过去了。但谁能保证,这种钻法律空子的擦边球,最后不沦为犯罪的手段? AI的�

  • AI日报:MiniMax公布上市后首份财报;千问开源Qwen3.5小型模型系列;Claude Code官方语音模式上线

    本期AI日报涵盖多项重要动态:MiniMax发布上市后首份财报,展示其AI平台战略进展;阿里通义千问开源Qwen3.5小型模型系列,支持多模态处理,适用于边缘设备;Google NotebookLM上线信息图自定义样式功能,简化知识可视化流程;Claude Code推出语音模式,提升编程协作效率;疑似GPT-5.4细节泄露,或具备超长上下文和状态化能力;Zopia实现多智能体协作自动化视频制作;QM发布2025年AI应用榜,豆包、DeepSeek、元宝等位列前五;DeepSeek V4 Lite凭借2000亿参数展现顶尖性能,成为国产模型新标杆。整体显示AI技术正快速向多模态、轻量化、场景化方向演进。

今日大家都在搜的词: