首页 > 业界 > 关键词  > InstructIR最新资讯  > 正文

InstructIR:可按照人类指令进行高质量图像修复

2024-02-01 15:47 · 稿源:站长之家

划重点:

⭐图像恢复模型使用可以针对特定损伤的信息作为指导恢复模型的提示

第一种使用人工编写的指令来指导图像恢复模型的方法

InstructIR在多项目恢复任务取得了最先进的成果,包括图像去噪、去雨、去模糊、去雾和(低光)图像增强。

站长之家(ChinaZ.com)2月1日 消息:图像恢复是一个基本问题,涉及从模糊的照片中恢复高质量的干净图像。多合一图像恢复模型可以使用特定于退化的信息作为指导恢复模型的提示,有效地从各种类型和级别的退化中恢复图像。

研究人员提出了第一种使用人工编写的指令来指导图像恢复模型的方法InstructIR。在自然语言提示的情况下,InstructIR模型可以从退化的对应图像中恢复高质量图像。

image.png

InstructIR 将图像和人工编写的有关如何改进该图像的指令作为输入。(单个)神经模型执行多合一图像恢复。InstructIR 在多项修复任务上取得了最先进的结果,包括图像降噪、去雨、去模糊、去雾和(低光)图像增强。

image.png

InstructIR 比以前的一体化恢复方法提高了 +1dB。此外,数据集和结果代表了文本引导图像恢复和增强新研究的新基准。

值得一提的是,该模型主要使用合成数据进行训练,因此它可能不适用于现实世界的复杂图像。然而,它在现实世界的雾蒙蒙和低光图像上效果出奇地好。你还可以尝试常规图像增强提示(例如,“修饰此图像”、“增强颜色”),看看它如何改善颜色。

产品入口:https://top.aibase.com/tool/instructir

论文网址:https://arxiv.org/pdf/2401.16468.pdf

项目代码:https://github.com/mv-lab/InstructIR

举报

  • 相关推荐
  • AI日报:腾讯重磅发布混元图像3.0;快手发布KAT系列Agentic Coding大模型;苹果悄然研发ChatGPT式应用

    快手发布KAT系列代码大模型,腾讯推出“混元图像3.0”实现多模态突破,苹果研发类ChatGPT应用升级Siri,谷歌更新Gemini 2.5 Flash Lite提升效率。苹果还推出Manzano图像模型,YouTube Music测试AI音乐主播功能,VideoFrom3D框架简化3D视频生成,Moondream 3.0在多项基准测试中超越GPT-5等顶尖模型,展现强大性能。

  • 微信新功能上线:长按图片“搜一搜” 检索购物转表一键达

    微信近日推出创新功能“搜一搜”,用户长按图片即可快速检索相关信息、直达购物或转换表格。该功能在信息检索方面表现突出,用户无需打开浏览器即可获取图片相关的历史、科学等专业内容。同时支持购物直达,系统自动关联商品购买渠道,实现“看图购物”。此外,还能一键将图片中的表格转为可编辑格式,提升工作效率。适用于iOS 8.0.59及以上、安卓8.0.58及以上版本,网友称赞其便捷高效。

  • StarRocks Connect 2025 圆满落幕:AI Native 时代,数据分析未来已来

    StarRocks Connect 2025峰会圆满落幕,聚焦AI Native时代的数据分析未来。活动汇聚全球开发者与行业专家,分享StarRocks在复杂业务场景中的实践,探讨技术演进方向。从性能引擎到AI原生平台,StarRocks 4.0将支持多智能体协作框架,提升数据分析效率。多家企业展示应用案例,覆盖电商、金融、旅游等领域,验证了其高性能与成本优势。开源精神推动技术创新,共同探索数据智能的无限可能。

  • 不让苹果17 Air独美!联想官宣moto X70 Air新机 又轻薄又有AI

    联想宣布moto X70 Air将于10月底上市,主打“有AI的Air”概念。该机以超薄设计为亮点,背部采用微凸双摄,外观舒适。对比iPhone 17 Air的5.6mm厚度和165g重量,moto新机具体配置未公布,但有望在轻薄度上超越苹果,引发市场期待。

  • 易鑫发布Agentic大模型,破解汽车金融风控与效率痛点

    9月12日,易鑫集团在“IT Value Summit数字价值年会”上入选“2025创新场景年度AI应用TOP榜”,成为汽车金融科技领域唯一上榜企业。首席科技官贾志峰指出,易鑫以AI为核心驱动力,通过自研大模型“智鑫多维”等技术,显著提升风控水平与融资通过率,推动行业智能化转型。平台已连接全国4.2万家经销商及上百家金融机构,服务覆盖牧民、基层员工等多元群体,体现技术普惠价值。未来将持续加大科技创新投入,深化国内普惠金融服务,并探索技术出海,助力全球汽车金融行业迈向更高水平智能化。此次上榜不仅是对其技术实力的认可,更反映出行业正加速拥抱智能化变革。

  • 数贸会今日开幕!每日互动展台人气火爆,GAI Station引领AI办公新体验

    2025全球数字贸易博览会于9月25日在杭州开幕。每日互动公司(展位7A-T022)集中展示了AI产业实践与数据流通领域成果,重点推出10万元级智能工作站GAI+Station,集成写作、会议纪要、智能问答等功能,内置8大模型能力,破解成本与安全痛点。其“发数站”战略打通数据高效流通链路,已在医疗、交通等多领域落地,“数智绿波”应用覆盖全国30多个省市,通行效率提升20%以上。此外,AITA超级营销助手实现升级,机器狗互动表演吸引关注。展会期间将举办10余场专业发布,涵盖数据要素、大模型应用等行业实战,助力企业把握数字化机遇。

  • 曝苹果为新Siri做了内部版ChatGPT 正测试搜索个人数据、执行App内操作等功能

    苹果公司正在开发一款类似ChatGPT的手机应用“Veritas”,用于内部测试明年将推出的新版Siri。该应用可快速评估Siri新功能,包括搜索个人数据、执行App内操作(如编辑照片)等。虽然不面向消费者发布,但该工具标志着苹果对Siri的全面升级已进入新阶段,旨在帮助员工高效完成测试。

  • Testin 云测入选 “2025 新科技 100 强金 i 奖”,AI测试技术成核心壁垒

    9月19日,Testin云测凭借AI测试技术入选“2025新科技100强金i奖”,获评“AI测试领航服务商”。其推出的Testin XAgent系统通过自然语言处理、视觉识别与自主探索能力,实现测试用例自动生成与全流程覆盖,推动软件测试从自动化向智能化升级。同时,Testin积极参与行业标准制定,联合信通院启动智能测试能力评估体系,助力构建规范化行业生态。目前,Testin已服务超300万款应用,未来将持续以AI为核心引擎,重塑软件研发质量效能,彰显中国技术在AI测试领域的领先实力。

  • Matrixport 加密基金获 FCA 营销许可,机构化投资通道加速成型

    2025年9月11日,Matrixport旗下旗舰产品Crypto Market Index Fund获得英国FCA营销许可,成为首个可在英国向专业投资者私募销售的瑞士加密基金。该基金追踪瑞士SIX交易所的CMI10指数,覆盖BTC、ETH等十大主流加密资产,采用合规基金结构,由FINMA监管。此次突破体现了Matrixport"双轮驱动"战略:持续优化产品结构与深化合规运营,为机构提供透明安全的数字资产配置工具。

  • 华为AI城市峰会:共建城市数智底座,AI CITY先锋城市案例发布

    9月18日,华为全联接大会2025期间举办AI城市峰会,聚焦智慧城市治理、政务服务与产业升级。华为发布“AI CITY 1234MNX”参考架构,通过智能云底座、安全保障体系及统一平台,推动城市全域智能化转型。会议分享了深圳、广州等地的实践案例,展示AI在政务、城市管理及工业领域的应用成效,并呼吁各方共建AI城市生态,加速数字化进程。

今日大家都在搜的词: