首页 > 业界 > 关键词  > 正文

苹果开源的图片编辑神器MGIE怎么用?MGIE下载地址在哪

2024-02-06 10:01 · 稿源:站长之家用户

几天前,库克在苹果电话会上证实,「今年晚些时候会发布生成式AI」。这一消息引起了广泛的关注,尤其在ChatGPT掀起全球热潮之后,苹果也在悄悄发力AI领域。据透露,苹果曾曝出的大模型框架Ajax、AppleGPT等AI工具让业界充满期待。在即将举办的WWDC上,苹果预计将宣布将各种AI能力整合到iOS18、iPadOS18等软件产品中。

然而,在这之前,iPhone用户已经可以提前体验到AI超能力!只需动动嘴,就可以在短短10秒内完成照片编辑,让照片中的哭脸变成笑脸、照片提亮、移除背景人物等。这项神奇的技术背后是由一个基于自然语言修改图片的新模型——MGIE加持,由UCSB和苹果全华人团队共同完成。(MGIE项目下载地址见文末)

image.png

具体来说,通过多模态模型,用户可以用简短的话语实现出色的图像编辑能力。这项技术已经在今天正式开源,为用户带来了前所未有的编辑体验。

根据最新研究,多模态大模型(MLLM)能够自然地将图片作为输入,并提供视觉感知响应,展现出强大的能力。MGIE作为MLLM的应用,结合扩散模型,可以通过给定的指令对输入图像进行编辑,实现预期的目标。

image.png

与其他类似模型相比,MGIE在处理模糊的人类指令方面表现出色,能够准确理解并执行编辑任务。研究人员使用了IPr2Pr作为预训练数据集,其中包含了大量的指令和图像数据,以进行模型的训练和评估。实验结果表明,MGIE在各种编辑任务中取得了显著的成绩,包括Photoshop风格的修改、全局照片优化和局部对象修改。

通过学习基于指令的图像编辑,研究人员发现,MGIE可以根据明确的指导执行准确的编辑任务,从而增强了图像编辑的效果。在零样本和微调场景中,MLLM引导图像编辑都取得了巨大的改进。

研究人员还探索了不同的架构来使用表达指令,结果显示具有关键视觉感知的表达指令始终具有优势。综合来看,MGIE在图像编辑领域展现出了强大的潜力,并为用户提供了更加直观、高效的编辑方式。随着这一技术的不断完善和推广,相信将会给用户带来更多惊喜和便利。

剩余10%的图文内容打赏作者后可查看

举报

  • 相关推荐
  • 修图神器PS引入ChatGPT:用户一句话即可编辑

    Adobe正式宣布,在ChatGPT中推出Photoshop、Express和Acrobat的集成功能。 用户现可通过对话界面,直接在ChatGPT内调用这些工具进行创作、编辑与文档处理。 Adobe数字媒体总裁David Wadhwani表示,此次集成将Adobe的创意创新能力与ChatGPT的便捷交互相结合,助力更多人轻松实现创作。 这一发布基于Adobe在对话式人工智能和模型上下文协议(MCP)领域的持续创新。此前,Adobe已推出Acrobat Stud

  • 顾客用AI图片退款掉包退货 卖家二次申诉被拒后直接报警

    近日,用户利用AI图片成功退款”的话题,引起关注热议。 日前,一位电商卖家发视频分享了被用户使用AI P图退款的后续。 卖家展示的图片中,他卖出去银色的行李箱,被顾客用AI P成了破损状态,行李箱上有多处凹陷。随后,顾客申请退货退款,但退回来的箱子被掉包,并非他卖出的那件。 卖家称,他第一次申诉失败了,然后又进行了第二次申诉,并且告诉买家,如果申�

  • AI日报:蚂蚁发布“阿福”App;OpenAI Sora 安卓版开发揭秘;Figma AI图像编辑功能上新

    本期AI日报聚焦多项AI领域新动态:OpenAI利用GPT-5.1-Codex高效开发Sora安卓版,85%代码由AI生成;蚂蚁集团升级AI健康应用“蚂蚁阿福”,新增健康陪伴等功能;Figma推出AI图像编辑工具,提升设计效率;深圳地铁上线全球首款AI导盲犬“小蒜”,服务视障人士;Adobe将Photoshop等工具集成至ChatGPT界面,方便用户编辑;OpenAI十周年推出Sora收藏卡等周边产品;谷歌Gemini新增NotebookLM功能,聊天可直接附加笔记;OpenAI计划推出ChatGPT“成人模式”,预计2026年前上线。

  • 具身智能驱动柔性制造,普罗宇宙AIE2025展示工业新范式

    近日,工信部等六部门联合发布方案,提出推广柔性化与定制化生产模式,实施“千厂千面”改造计划。普宙机器人展示了工厂流水线智能解决方案和灵巧手灵动方案,为柔性制造提供创新技术路径。其方案依托自研SDPAA大模型,实现高精度定位与分秒级换线,显著提升生产效率与产品一致性。灵巧手方案则能适应多样化、非结构化任务环境,具备柔性操作与精密控制能力。这些方案已在扫地机、消费电子等多个工厂产线落地应用,成为具身智能驱动柔性制造的典范。

  • 视源股份科研教育级机械臂首秀2025年IEEE国际机器人与仿生学大会

    2025年12月3日至7日,IEEE国际机器人与仿生学大会(ROBIO 2025)在成都召开,主题为“AI赋能的仿生机器人”。大会聚焦近20个前沿议题,汇聚全球顶尖学者与产业专家。视源股份首次亮相其科研教育级机械臂及配套教学级数采教学平台,该平台以开放硬件与软件生态,支持多编程环境,并能与主流开源机器人模型集成,旨在降低科研与教学门槛,助力机器人算法验证、数据采集与模型训练,为全球科研教育工作者提供易用工具,推动技术创新与人才培养。

  • 观影神器测评:海信100寸电视如何再造客厅娱乐新体验

    海信100英寸电视E7Q重新定义了客厅娱乐体验。它不仅是家庭影院,更是全能型选手:原生4K 170Hz超高刷新率配合HSR技术可提升至330Hz,确保游戏画面流畅无拖影;搭载信芯AI画质芯片,能智能优化观影体验,如根据环境光自动调节亮度与色温;178°超广视角让全家都能享受精准色彩。它融合了顶级影音、专业电竞与智能家居,堪称客厅娱乐新物种。

  • 微信公众号编辑器哪个好用?推荐这款带AI自动排版的工具

    2025年微信公众号数量突破3000万,内容创作者日均花费3.2小时排版。在此背景下,高效排版工具至关重要。小墨鹰编辑器以96%的AI识别准确率和30秒极速排版能力脱颖而出,成为行业优选。其核心优势包括:AI智能排版技术30秒完成全文排版,效率提升3600%;支持25万+素材智能匹配;海量素材库持续更新,覆盖45个行业;操作便捷,支持多端同步。用户反馈显示,使用后排版时间从3小时缩短至10分钟,团队效率提升18倍。小墨鹰凭借持续创新的AI技术和强大素材库支持,服务500万用户,真正实现“让排版不再是负担”,是公众号运营者值得信赖的排版伙伴。

  • 3个PCIe插槽、支持4个ECC内存,Ultra 9 285HX企业级迷你工作站铭凡MS-02 Ultra亮相

    铭凡正式推出第二代高性能迷你工作站MS-02Ultra,仅4.8升的超紧凑体积,融合全塔级性能与极致的扩展能力。MS-02Ultra最高搭载Intel® Core™ Ultra9285HX处理器,具备24核心、24线程,最高睿频达5.4GHz,支持100W持续高性能输出,多核性能较前代产品提升高达117%。配合13TOPS NPU,在AI、多媒体、性能释放与能效优化方面都更出色。在扩展能力上,MS-02Ultra堪称“同级天花板”。MS-02Ultra配备3

  • 熊猫宝宝聚餐横七竖八躺成一片 网友:从小就会享受

    近日,一段熊猫宝宝“聚餐”时横七竖八躺成一片的视频在网络上迅速走红,引发了众多网友的关注和热议。 视频中,一群熊猫宝宝在成都大熊猫繁育研究基地内围坐在一起“聚餐”,然而它们并没有端端正正地坐着,而是或仰卧或侧躺,姿态各异,显得十分随性。有的熊猫宝宝仰面朝天,竹笋举在胸前慢条斯理地啃着;有的则侧身而卧,边吃边打起小呼噜,憨态可掬的模样

  • 最轻大折叠!vivo X Fold5升级OriginOS 6 韩伯啸:轻办公神器 6到飞起

    今年6月发布的vivo X Fold5折叠屏将重量控制在了217g,打破了vivo X Fold3保持的轻薄纪录,成为行业内最轻大折叠屏。 这款折叠屏出厂搭载的是OriginOS 5系统,vivo产品经理韩伯啸表示,vivo已向X Fold5推送OriginOS 6,有很多升级点非常适合X Fold5,大家可以多感受一下,相信你一定会感叹轻办公神器,6到飞起”。 在OriginOS 6上,vivo X Fold5支持双机互联,MacBook上的文件能迅速传输给vivo X F

今日大家都在搜的词: