首页 > 业界 > 关键词  > Upscale-A-Video最新资讯  > 正文

南洋理工大学研究人员推出研究人员发布Upscale-A-Video:利用文本提示提升视频超分辨率

2023-12-18 16:53 · 稿源:站长之家

**划重点:**

1. 🌐 视频超分辨率面临多种挑战,NTU研究人员采用潜在扩散框架中的本地-全局时间一致性策略,通过文本提示引导纹理创作,实现真实细节的卓越提升。

2. 🔄 通过本地微调和全局潜在传播模块,研究团队解决了CNN模型在生成真实纹理方面的限制,提高了视频局部和整体结构的稳定性。

3. 🎥 研究结果展示Upscale-A-Video在超分辨率性能上表现卓越,通过对比人工智能生成和真实视频超分辨率,呈现出更高的视觉逼真度和更精细的细节。

站长之家(ChinaZ.com)12月18日 消息:近日,新加坡南洋理工大学(NTU)的研究人员成功发布了一项名为"Upscale-A-Video"的视频超分辨率技术,通过开创性的文本引导潜在扩散方法,旨在提升低质量视频的视觉质量。

视频超分辨率领域面临着在真实场景中常见的多样且复杂的降质问题,包括但不限于降采样、噪音、模糊、闪烁和视频压缩等因素。传统的基于卷积神经网络(CNN)的模型在缓解这些问题方面取得了一定进展,但由于生成能力有限,容易产生过度平滑的纹理,导致生成的视频缺乏真实感。

image.png

为了应对这些挑战,NTU的研究团队采用了本地-全局时间一致性策略,结合了潜在扩散框架。在本地层面,预训练的放大模型经过微调,集成了额外的时间层,包括3D卷积和时间注意力层,显著提高了本地序列的结构稳定性,减少了纹理闪烁等问题。同时,引入了一种新颖的流引导的递归潜在传播模块,以全局的方式进行操作,通过逐帧传播和潜在融合确保了较长视频的整体稳定性。

研究中探索了引入文本提示来引导纹理创建的创新方法,使模型能够生成更真实和高质量的细节。此外,通过向输入注入噪音,增强了模型对于重度或未知降级的鲁棒性,为恢复和生成之间的平衡提供了控制。较低的噪音水平优先考虑恢复能力,而较高水平则鼓励更精细的细节生成,实现了保真度和质量之间的权衡。

研究的主要贡献在于设计了一种强大的方法来解决真实场景视频超分辨率的问题,将本地-全局时间策略与潜在扩散框架相融合。通过引入时间一致性机制和对噪音水平和文本提示的创新控制,该模型在基准测试中表现出卓越的视觉逼真度和时间一致性。

NTU的研究不仅在技术上取得了显著进展,更为实现视频超分辨率的真实性和高质量提供了新的可能性。

举报

  • 相关推荐
  • “无限量”供应Claude,就是AI IDE们的百亿补贴

    Anthropic于2025年7月28日宣布,将从8月28日起对Claude Code工具新增每周调用限额——因为少数重度用户全天候高频使用,一次使用成本甚至高达数万美元,远远超过普通订阅预期。 同样在上个月,Cursor曾因其“I’ll keep it unlimited”的Pro收费模式悄然变更为计算tokens限制,导致大量用户抱怨“实际上并非无限”,纷纷在社群中吐槽,迫使公司CEO出面道歉、甚至给出退款补偿。 这两�

  • ISC.AI PARK:科技博主集体打卡!AI原来可以这么“酷”

    ISC.AI2025大会8月6-7日在北京国家会议中心成功举办,以"ALL IN AGENT"为主题。展会全新升级为"ISC.AI PARK",吸引超万名观众参观。360集团、华为、百度智能云等科技巨头及行业领军企业参展,集中展示了AI与数字安全领域的前沿技术和创新应用。AI互动区设置办公、生活、娱乐等场景体验,机器人表演、智能设备等吸引观众驻足。科技博主现场互动体验AI赋能安全行业的产品,直观感受AI技术带来的变革。大会展现了AI技术在各领域的融合应用,推动构建更安全智能的世界。

  • ISC.AI 2025智能体驱动产业创新论坛圆满召开

    8月6日,第十三届互联网安全大会智能体驱动产业创新论坛在北京召开。论坛汇聚产学研专家,围绕AI技术前沿、智能体研发与产业落地展开研讨,探讨技术创新与产业融合趋势。与会专家指出,智能体发展需兼顾技术突破与安全可控,构建开放协同的产业生态。会议展示了智能体在金融、制造等领域的应用成果,强调技术安全双轮驱动的重要性,呼吁共建智能体发展共同体,推动产业变革。

  • 安全智能体引领防御变革 ISC.AI 2025论坛呈现多维度实践成果

    ISC.AI2025安全智能体技术论坛在北京召开,聚焦AI赋能网络安全新范式。论坛汇集专家与企业代表,围绕安全智能体的实战应用、技术架构及行业落地展开研讨。360集团提出安全智能体需具备感知、推理、决策等四大能力,并展示了终端防护、流量分析等场景的智能解决方案。专家指出,AI驱动的攻击防御已成趋势,需构建自动化、通用化的安全体系。论坛成果为数字时代安全防御体系的智能化升级提供了实践路径。

  • GPT-5和Claude 4 Opus谁更强?用这个AI大模型对比工具一眼明了

    OpenAI正式发布GPT-5,与Claude4Opus和Gemini2.5Pro进行对比测试。GPT-5在编程能力(SWE-bench测试74.9%)和数学推理(AIME2025测试94.6%)表现突出;Claude4Opus编程优异(72.5%)但数学较弱(33.9%);Gemini2.5Pro擅长长文本处理(100万token窗口)和多模态应用。价格方面,GPT-5和Gemini2.5Pro定价相近($1.25-$10),Claude4Opus较高($15-$75)。建议根据需求选择:GPT-5适合综合应用,Claude4Opus适合专业编程,Gemini2.5Pro适合长文档�

  • ISC.AI 2025 人工智能安全治理与创新实践论坛圆满召开

    ISC.AI2025人工智能安全论坛在北京召开,聚焦AI安全治理与创新实践。论坛汇集顶尖专家,探讨大模型安全评估与防护、智能体安全、AI治理等前沿议题。360集团张向征指出,随着Agent技术爆发式应用,AI安全已成为产业核心焦点。专家们强调需构建AI安全防护体系,应对大模型直接访问核心系统带来的全新挑战。中国电子院彭健提出企业合规建设需关注九大要素,清华大学苏航揭示智能体安全风险远超传统AI。华为云范建军倡导端到端大模型安全防护,中国信通院杨哲超呼吁构建协同治理框架。论坛为构建安全、普惠、负责任的人工智能未来贡献智慧。

  • ISC.AI 2025在京开幕:开启智能化时代全球发展新纪元

    8月6日,第十三届互联网安全大会(ISC.AI2025)在北京国家会议中心开幕。大会以"ALL IN AGENT"为主题,聚焦智能体技术创新与产业融合,探讨人工智能与网络安全协同发展。来自政府、企业、学术界的代表就AI安全治理、技术突破、产业应用等议题展开讨论。会议指出,AI技术正重构安全攻防体系,需在推动创新的同时确保安全性、可靠性和公平性。大会由360等机构承办,采用纳米AI智能体技术支持,通过虚实融合方式呈现创新成果,并设置特色活动展示前沿技术应用。

  • ISC.AI 2025周鸿祎:应对“超级黑客”威胁 安全智能体成破局关键

    8月6日,360集团创始人周鸿祎在ISC.AI2025大会上提出"ALL IN AGENT"战略,强调AI时代需要安全智能体应对"超级黑客"威胁。安全智能体以安全大模型为核心大脑,配合工具调用等实操功能,能精准复制人类安全专家能力,实现安全防护从量变到质变的突破。周鸿祎回顾360二十年深耕安全领域的历程,指出当前企业面临安全人才短缺和AI黑客威胁双重挑战。360已实现全线产品智能化,通过自主研发的"智能体工厂"打造安全智能体解决方案,帮助政企单位快速弥补人才短板。安全智能体不仅是传统安全的补充,更是重构数字安全体系的核心力量。

  • AI日报:B站测试AI视频工具花生AI;腾讯发布多模态模型Large-Vision;昆仑万维开源Skywork UniPic 2.0

    【AI日报】主要内容: 1. B站测试"花生AI"视频工具,3分钟可成片,同时推进自研大模型和多语言翻译功能 2. 昆仑万维开源多模态模型Skywork UniPic 2.0,实现高效统一的多模态生成能力 3. 马斯克指责苹果偏袒OpenAI,苹果回应称平台设计公平公正 4. 腾讯混元发布52B参数多模态理解模型Large-Vision,支持任意分辨率输入 5. DeepSeek官方否认8月发布R2模型的传闻 6. OpenAI推出超值ChatGPT Go套餐,仅399卢比降低使用门槛 7. AI新贵Perplexity豪掷345亿美元收购谷歌Chrome 8. Anthropic的Claude Sonnet 4模型支持100万token上下文 9. ChatGPT重大更新:恢复GPT-4o默认模式,为GPT-5引入多模式选择,优化交互体验

  • MCP服务库完整指南:如何选择最适合的Model Context Protocol服务

    本文介绍了MCP(Model Context Protocol)作为连接大型语言模型与外部数据源的重要桥梁。随着AI技术发展,选择合适的MCP服务库对开发者至关重要。文章分析了MCP服务库的核心价值:提升开发效率、增强系统互操作性、降低技术门槛。评估MCP服务库质量需考虑协议兼容性、安全性、生态系统丰富度及社区活跃度等维度。建议开发者根据业务需求选择服务,初创公司可侧重简便性,大型企业应关注安全性和扩展性。文章还指出MCP服务未来将向云原生化、智能化运维和标准化方向发展,并推荐使用专业对比平台(如mcp.aibase.cn)辅助决策。

今日大家都在搜的词: