首页 > 业界 > 关键词  > InstructIR最新资讯  > 正文

InstructIR:可按照人类指令进行高质量图像修复

2024-02-01 15:47 · 稿源:站长之家

划重点:

⭐图像恢复模型使用可以针对特定损伤的信息作为指导恢复模型的提示

第一种使用人工编写的指令来指导图像恢复模型的方法

InstructIR在多项目恢复任务取得了最先进的成果,包括图像去噪、去雨、去模糊、去雾和(低光)图像增强。

站长之家(ChinaZ.com)2月1日 消息:图像恢复是一个基本问题,涉及从模糊的照片中恢复高质量的干净图像。多合一图像恢复模型可以使用特定于退化的信息作为指导恢复模型的提示,有效地从各种类型和级别的退化中恢复图像。

研究人员提出了第一种使用人工编写的指令来指导图像恢复模型的方法InstructIR。在自然语言提示的情况下,InstructIR模型可以从退化的对应图像中恢复高质量图像。

image.png

InstructIR 将图像和人工编写的有关如何改进该图像的指令作为输入。(单个)神经模型执行多合一图像恢复。InstructIR 在多项修复任务上取得了最先进的结果,包括图像降噪、去雨、去模糊、去雾和(低光)图像增强。

image.png

InstructIR 比以前的一体化恢复方法提高了 +1dB。此外,数据集和结果代表了文本引导图像恢复和增强新研究的新基准。

值得一提的是,该模型主要使用合成数据进行训练,因此它可能不适用于现实世界的复杂图像。然而,它在现实世界的雾蒙蒙和低光图像上效果出奇地好。你还可以尝试常规图像增强提示(例如,“修饰此图像”、“增强颜色”),看看它如何改善颜色。

产品入口:https://top.aibase.com/tool/instructir

论文网址:https://arxiv.org/pdf/2401.16468.pdf

项目代码:https://github.com/mv-lab/InstructIR

举报

  • 相关推荐
  • 阿里云vTrus SSL证书夏季大促,最高直降60%!

    阿里云推出vTrus+SSL证书服务,简化HTTPS部署流程,提升云上证书管理效率。该国产证书已通过国际WebTrust认证,兼容360、奇安信等主流浏览器,并深度参与Tongsuo开源社区建设。2025年7月1日至31日,阿里云推出SSL证书限时优惠活动:GeoTrust证书首购4折起,全系列证书享"新老同享"75折优惠,助力企业实现安全高效的国产化证书部署需求。

  • AI日报:12306 MCP Server上线;百度推AI搜索助手Tizzy.ai;ChatGPT录音模式面向Plus用户开放

    【AI日报】今日AI领域重要动态:1)百度推出无广告智能搜索助手Tizzy.ai,整合影视资源与深度思考功能;2)12306开源火车票查询引擎上线,采用FastAPI架构实现秒级响应;3)ChatGPT向Plus用户全面开放录音功能,支持实时记录与内容总结;4)开源SaaS模板FireGEO助力快速构建现代化Web应用;5)国产工具ReadMeX可一键生成高质量GitHub文档;6)百度AI助手新增视频通话功能,支持方言识别;7)Jacky

  • 每日互动AI一体机GAI Station:安全融合大模型与大数据 高效驱动企业业务增长

    文章介绍了GAI+Station智能工作站如何解决大模型产业应用中的安全与效率难题。该产品采用"本地小模型+云端大模型"混合部署模式,确保敏感数据不出域的同时调用大模型能力,支持27+文档格式解析和8大模型能力,可快速构建企业知识库。其特色包括:1)数据安全可控,原始数据本地处理;2)深度整合业务流与数据库,提升决策效率;3)预置16大权威知识库,支持行业定�

  • TECNO发布全球最薄三折概念机PHANTOM Ultimate G Fold

    TECNO发布PHANTOM Ultimate G Fold概念机,采用创新双屏内折设计,配备9.94英寸柔性大屏,折叠状态下厚度仅11.49mm,展开后最薄处3.49mm,刷新三折手机轻薄纪录。其核心创新在于独特的G型三折结构,通过左右双内折实现屏幕完全内藏保护,并配备外屏保证折叠状态下的常规使用体验。该机采用精密双铰链系统,支持多角度悬停,搭配2000MPa高强度钢铰链和0.3mm超薄钛纤维背板,兼顾强度与轻薄。量产版将搭载高性能芯片、多焦段三摄系统和超5000mAh电池,重新定义旗舰折叠屏体验。

  • AI日报:美图发布影像AI Agent RoboNeo;1.8bit量化Kimi K2模型上线;亚马逊推AI代码编辑器 Kiro

    【AI日报】今日AI领域重要动态:1)美图推出RoboNeo,通过自然语言指令实现图片精修、品牌设计等全能影像处理;2)Unsloth AI将Kimi K2模型量化至1.8bit,体积缩减78%保持性能;3)谷歌Gemini嵌入模型登顶MTEB榜单,超越OpenAI;4)亚马逊发布免费AI代码编辑器Kiro,集成Claude模型;5)Claude新增应用工具目录功能提升工作效率;6)MiniMax完成近3亿美元融资,估值超40亿美元;7)UTCP新协议让AI代理直

  • vivo以Rust语言自研的蓝河操作系统内核正式开源

    7月23日,2025开放原子开源生态大会召开。vivo宣布其自主研发的蓝河操作系统(BlueOS)内核正式开源。该系统采用Rust语言编写,具备智慧、流畅、安全三大特性,是行业首个从内核到框架全栈使用Rust的操作系统。蓝河内核内存占用仅13KB,兼容RISC-V、ARM等架构,支持POSIX接口标准,包含系统调度、内存管理等五大核心能力。vivo表示,此次开源将为国产操作系统发展提供新思路,推动行业迈向新高度。未来vivo将持续推进Rust语言在国内的普及,并举办第三届蓝河操作系统创新大赛。

  • ​汽车软件质量管控新范式:AI 驱动的智能座舱测试革新(Testin云测案例)

    文章概述了汽车产业智能化转型趋势,指出智能化、网联化、电动化"三驾马车"正重塑行业格局。重点介绍了Testin云测凭借XAgent智能座舱AI测试系统入选"2025汽车智能服务企业TOP50",成为唯一获选的AI测试服务商。该系统融合机器视觉、自然语言处理等AI技术,支持跨端自动化测试,实现测试效率提升3倍、缺陷检测率提升55%,帮助某头部车企节省超千万元测试成本。文章强调AI测试技术正成为解决汽车软件质量与安全难题的关键,Testin云测作为行业先行者,将持续推动汽车产业智能化升级。

  • 微信iOS又有新功能 聊天终于能发实况图片了

    日前,微信iOS版又迎来新功能与好友聊天支持发送实况照片,目前为灰度测试阶段。 据了解,使用该功能需要将微信iOS更新至8.0.61版本及以上,默认实况为关闭状态,发送照片时点击进入大图预览页面可手动开启单个照片的实况开关。

  • AI4Test vs. Test4AI:谁将主导未来软件测试未来?

    本文探讨AI技术对软件测试领域的双重变革:AI4Test(AI赋能传统测试)和Test4AI(AI系统测试)。AI4Test通过自然语言处理、视觉识别等技术提升测试效率,如Testin平台实现99%的识别精度;Test4AI则专注大模型幻觉检测、偏见分析等新挑战。金融和自动驾驶领域已显现应用价值,但面临数据依赖和复合型人才短缺问题。未来趋势包括:大模型即服务(MaaS)融合、全链路自动化、重构概率化质量评估标准。Gartner预测到2026年40%企业将采用AI全自动测试。这场变革正重新定义质量保障边界,推动测试人员从"脚本工人"转型为"质量策略师"。

  • 销量破万,多地售罄!出门问问TicNote全球热销触发紧急补货

    出门问问(02438.HK)推出AI硬件产品TicNote,全球销量已破万台。该产品搭载"Shadow AI"系统,具备记录、分析、创作等智能功能,实现软硬件结合。TicNote在国内天猫、京东相关品类排名前二,部分区域已断货。作为公司十年AI技术积累的成果,TicNote致力于成为用户的随身AI思考伙伴。出门问问持续深耕AI核心技术,未来将以"Shadow AI"为基础,拓展更多应用场景。目前产品正在紧急补货中,用户可通过京东、天猫旗舰店购买。