首页 > 业界 > 关键词  > InstructIR最新资讯  > 正文

InstructIR:可按照人类指令进行高质量图像修复

2024-02-01 15:47 · 稿源:站长之家

划重点:

⭐图像恢复模型使用可以针对特定损伤的信息作为指导恢复模型的提示

第一种使用人工编写的指令来指导图像恢复模型的方法

InstructIR在多项目恢复任务取得了最先进的成果,包括图像去噪、去雨、去模糊、去雾和(低光)图像增强。

站长之家(ChinaZ.com)2月1日 消息:图像恢复是一个基本问题,涉及从模糊的照片中恢复高质量的干净图像。多合一图像恢复模型可以使用特定于退化的信息作为指导恢复模型的提示,有效地从各种类型和级别的退化中恢复图像。

研究人员提出了第一种使用人工编写的指令来指导图像恢复模型的方法InstructIR。在自然语言提示的情况下,InstructIR模型可以从退化的对应图像中恢复高质量图像。

image.png

InstructIR 将图像和人工编写的有关如何改进该图像的指令作为输入。(单个)神经模型执行多合一图像恢复。InstructIR 在多项修复任务上取得了最先进的结果,包括图像降噪、去雨、去模糊、去雾和(低光)图像增强。

image.png

InstructIR 比以前的一体化恢复方法提高了 +1dB。此外,数据集和结果代表了文本引导图像恢复和增强新研究的新基准。

值得一提的是,该模型主要使用合成数据进行训练,因此它可能不适用于现实世界的复杂图像。然而,它在现实世界的雾蒙蒙和低光图像上效果出奇地好。你还可以尝试常规图像增强提示(例如,“修饰此图像”、“增强颜色”),看看它如何改善颜色。

产品入口:https://top.aibase.com/tool/instructir

论文网址:https://arxiv.org/pdf/2401.16468.pdf

项目代码:https://github.com/mv-lab/InstructIR

举报

  • 相关推荐
  • 中国移动北斗卫星短信业务升级:支持文字+图片+语音

    中国移动宣布北斗短信息服务完成重大升级,新增图片、语音等富媒体功能,文本传输能力显著提升,单条消息可发送40个汉字、接收达10个汉字。Redmi Note 15 Pro+卫星消息版率先支持升级,其他品牌终端也将陆续开启。此次升级在无地面网络信号时仍能通过多种形式传递信息,为户外探险、应急救援等场景提供坚实通信保障,标志着北斗通信正式步入“视听兼具”新时代。

  • 特斯拉磁悬浮Cybertruck车模上架中国官网 售价999元

    特斯拉磁悬浮Cybertruck车模11月12日在中国官网开售,定价999元。这款1:24比例模型精准还原实车细节,采用银色涂装与可亮车灯,内置14个LED灯,展现科技感。模型重293克,底座重1291克,确保稳定悬浮。使用时只需通电并放置于非金属表面,通过磁力实现悬浮效果,可静置观赏或轻触旋转,为收藏爱好者带来独特视觉体验。

  • 华为WATCH ULTIMATE DESIGN非凡大师紫金款明天开启预售

    华为11月14日推出WATCH ULTIMATE DESIGN非凡大师紫金款智能手表。该系列定位超高端,于2023年9月首次发布,由刘德华代言。新款采用18K黄金材质,设计灵感源自航海轮舵,表圈手工镶嵌六颗黄金,搭配黄金表圈、旋转表冠及可伸缩蝴蝶扣等精致设计,尽显奢华质感。功能方面支持双向北斗卫星消息、百米防水及健康管理,智能模式下续航达8天。新品将于11月15日10:08开启预售,面向追求高端独特风格的消费者。

  • 华为WATCH Ultimate 2非凡探索版明日开启预售

    华为正式宣布旗舰智能手表WATCH Ultimate 2非凡探索将于11月7日开启预售。这款“全能表王”支持150米潜水与音频功能,具备海豚声呐通信技术,可在水下30米实现手表间信息传输,60米内一键SOS求救。同时搭载北斗卫星语音消息功能,无网络环境下可通过卫星发送语音信息。硬件上配备1.5英寸OLED屏幕,峰值亮度达3500nit,支持20ATM防水与IP68/9防尘。省电模式下续航达11天,常规使用达4.5天。该手表海外售价799英镑(约7443元人民币),国内价格尚未公布。

  • TikTok Shop美区黑五重磅开启,黑五大战正式打响

    TikTok Shop美区黑五于11月13日启动,首次开展多市场联动大促。活动分三阶段:13-15日为开幕引爆期,16-27日为品类日蓄势期,28日至12月2日为冲刺高峰期。平台通过内容驱动增长,整合明星达人共创、千亿商品曝光及专项补贴资源,助力商家实现爆发。跨境与全托管模式提供结构化激励,多市场错峰接力延长热度,推动全球生意持续增长。

  • 开发者必看!2025开放原子开发者大会:解锁开源鸿蒙&开源欧拉实践、Rust实战与AI开源新机遇

    2025年11月21日至22日,北京亦庄将举办2025开放原子开发者大会,主题为“AI共治,开源共享”。大会汇聚全球开源项目、技术专家与开发者,探讨开源技术与AI融合的未来路径,覆盖操作系统、人工智能、数据库、量子计算等前沿领域。通过主题论坛、技术分论坛及项目展示,为开发者提供技术交流、生态共建及职业成长平台,助力开源社区发展。

  • 2025乌镇峰会:易鑫发布汽车金融行业首个Agentic大模型XinMM-AM1

    易鑫集团在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型具备300亿参数、响应延迟低于200ms等技术优势,能提升获客、风控与运营效率,优化用户体验。通过全链路智能决策能力,推动行业从"单点智能"转向"整体高效"。配套SaaS平台已覆盖超4万家经销商及百余家金融机构,显著提高融资通过率与业务质量,填补领域技术空白,引领汽车金融智能化发展。

  • 从“实现需求”到“共创价值”:AI Native时代需要什么样的工程师团队?

    在1024程序员节,小红书技术副总裁风笛出席CCF工程师文化日五周年庆典,分享AI时代技术团队转型方向。他指出传统开发模式下工程师仅1/3时间编码,其余被会议沟通挤占,导致技术成长受阻、创新力下降。提出AI Native时代需重构协作模式:通过任务导向的扁平化组织,让工程师从需求执行者转变为价值创造者。以48小时上线翻译功能为例,展示新型协作效能。强调AI不会取代工程师,而是将其角色提升至系统定义和复杂性管理的新高度。

  • 易鑫正式发布汽车金融行业首个Agentic大模型

    易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿,响应延迟低于200毫秒,支持语音实时交互,单卡吞吐达370 tokens/秒,可提升获客、风控与运营效率,解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台,研发投入超20亿元,率先实现AI全场景应用,将持续推动智能汽车金融生态建设。

  • 字节旗下AI编程工具TRAE SOLO发布 面向所有用户开放

    字节跳动AI编程工具TRAE SOLO正式版发布,面向国际用户开放。该工具提供IDE和SOLO两种开发模式:IDE模式在保留原有流程基础上增强智能问答、代码补全等AI能力;SOLO模式以AI为主导,能理解开发目标、调度工具并独立完成从需求分析到代码实现的全流程。这标志着AI编程从工具增强迈入流程重构新阶段,实现覆盖软件开发全流程的高度自动化。

今日大家都在搜的词: