新AI图像分割方法GenSAM：一个提示实现批量图片分割

2024-01-08 16:55 · 稿源：站长之家

划重点:
- 🔄 GenSAM模型旨在通过通用任务描述，摆脱对样本特定提示的依赖，实现对图像的有针对性分割。
- 🔍 该模型使用Cross-modal Chains of Thought Prompting（CCTP）思维链和Progressive Mask Generation(PMG)框架，实现任务通用的文本提示映射和自适应分割。
- 🚀 实验证明，GenSAM在伪装样本分割任务上相比基线方法和弱监督方法表现更好，具备良好的泛化性能。

站长之家（ChinaZ.com）1月8日消息:近期，研究人员提出了一种新型图像分割方法，称为Generalizable SAM（GenSAM）模型。该模型的设计目标是通过通用任务描述，实现对图像的有针对性分割，摆脱了对样本特定提示的依赖。在具体任务中，给定一个任务描述，例如“伪装样本分割”，模型需要根据任务描述准确地分割图像中伪装的动物，而不依赖于手动提供每个图像的具体提示。

为了解决这一问题，GenSAM模型引入了Cross-modal Chains of Thought Prompting（CCTP）思维链和Progressive Mask Generation(PMG)框架。CCTP思维链通过将任务通用的文本提示映射到任务下的所有图片上，生成个性化的感兴趣物体和其背景的共识热力图，从而获得可靠的视觉提示来引导分割。为了在测试时实现自适应，PMG框架通过迭代地将生成的热力图重新加权到原图上，引导模型对可能的目标区域进行从粗到细的聚焦。

GenSAM的实验结果表明，在伪装样本分割任务上，该模型相比基线方法和弱监督方法表现更好，具备良好的泛化性能。该模型的提出为像SAM这样的提示分割方法在实际应用中迈出了重要的一步。

这一研究的创新之处在于，通过提供通用任务描述，GenSAM模型可以批量地处理所有相关任务的无标注图片，而无需为每个图片手动提供具体的提示。这使得模型在处理大量数据时更加高效和可扩展。

在未来，GenSAM模型的方法可能为其他领域的图像分割任务提供新的思路和解决方案。研究人员希望这种通用任务描述引导的图像分割方法能够推动计算机视觉领域的发展，提高模型在复杂场景下的分割准确性。

论文链接:https://arxiv.org/pdf/2312.07374.pdf
项目链接:https://top.aibase.com/tool/gensam

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
AI图像编辑软件DesignEdit 像PS一样分图层处理图片

DesignEdit是一款突破性的图像编辑软件，它采用了设计领域中常见的图层概念，为用户带来了一种全新的空间感知图像编辑体验。通过将复杂的图像编辑任务分解为多层潜在的编辑操作，DesignEdit实现了对象移除、多对象编辑、镜头平移和缩放、排版编辑以及跨图像合成等一系列高级编辑功能。这不仅为创意设计提供了无限的可能性，也为图像合成和视觉特效制作带来了新的解决方案。

DesignEdit AI头条
ImagenHub官网体验入口 AI图像生成模型评估平台使用指南方法教程

ImagenHub是一个一站式库，用于标准化所有条件图像生成模型的推理和评估。该项目首先定义了七个突出的任务并创建了高质量的评估数据集。ImagenHub设计了两个人工评估指标，语义一致性和感知质量，并训练专家评审员根据这些指标对模型输出进行评估，获得了高的评估者间一致性。

ImagenHub
Garment3DGen：用衣服图片就能生成逼纹理效果的3D模型

研究人员提出了一种名为Garment3DGen的方法，旨在实现3D服装的风格化和纹理生成。该方法通过结合先进的计算机视觉技术和人工智能算法，为用户提供了一个简单高效的工具，用于实现服装设计的个性化风格化。随着这一技术的不断完善和推广，我们有理由相信，未来的服装设计将更加多样化和个性化。

Garment3DGen AI头条
新视频分割技术SAM 可高效识别移动物体

在视频分割领域，SegmentAnything模型被用于探索新的视频对象分割技术。研究团队测试了两种不同的模型，旨在结合SAM的分割能力和光流技术的优势，以提高视频分割的性能。具体的技术细节、模型性能指标以及未来的研究方向尚未详细公布，但这些初步的研究成果已经为视频分割技术的发展提供了新的方向和可能性。

SAM
Adobe图像生成AI “Firefly” 训练集中约有5%为AI图像

Adobe的图像生成AI“Firefly”以其训练集来源自AdobeStock中的图片和视频闻名。美国经济报纸彭博社报道称，Firefly的数据集实际上包含由Midjourney等公司生成的图像。”然，Tushnett教授指出，Firefly学习自Midjourney生成的图像的事实与其声称与其他图像生成AI不同的说法相矛盾。

Firefly Adobe AI头条
AI图像编辑工具Facet AI 实时图像生成，可精确控制图像元素

Facet AI是一款创新的图像编辑工具，它以其独特的功能和用户友好的操作界面，为广告制作和产品图像设计领域带来了革命性的变化。这款工具的核心优势在于其精确控制图像元素的能力，使得用户可以轻松地对图像进行实时编辑和调整。官网地址：https://facet.ai/Facet AI的直观画布操作是其一大亮点。用户可以通过简单的拖拽和调整，实现对图像

Facet AI头条
facet ai怎么用？AI图片编辑修图工具Facet AI详细使用教程（附产品入口）

产品简介：FacetAI是一款创新的图像编辑工具，以实时图像生成和精确控制图像元素为核心优势，为广告制作和产品图像设计领域带来革命性变化。用户可通过直观的画布操作实现对图像元素的精准控制，提高工作效率。侧边栏第二个按钮还支持对生成的图片进行风格，色调，光线的调整，这里就不一一赘述，大家可以根据自己的喜好来调整。

facet AI修图
Nightshade：使AI模型在未经许可的情况下无法训练图片

站长之家（ChinaZ.com）4月9日消息:据报道，芝加哥大学的研究人员开发了一种名为Nightshade的工具，旨在防止未经许可的AI图像生成。该工具可以使AI图像生成器无法使用未经许可的图像进行训练，从而保护了艺术家和版权所有者的作品。Nightshade的工作原理是在图像中添加隐藏信息，这些信息对人眼不可见。当像Stable Diffusion这样的AI图像生成器尝试使用这些图像进行训练时，这些

Nightshade AI头条
DreamWalk：实现对图像生成风格和内容的精细控制

在图像生成领域，精确控制图像的风格和特征一直是一个具有挑战性的问题。DreamWalk技术的出现为这一难题提供了解决方案，使得用户可以更加自由地决定图像中哪部分应该更加强烈地体现某种风格哪部分则保持原样或采用另一种风格。这一功能为用户提供了一种简单有效的方式，将他们的照片或收藏的图像转化为独特的艺术风格，从丰富了数字艺术的创作方式。

DreamWalk AI头条
AI文生图模型PixArt-sigma，可以生成4K分辨率图片

PixArt-sigma由华为诺亚方舟实验室联合多个研究机构共同开发的项目，是一个强大的文本到图像生成模型，通过弥散Transformer进行弱到强训练，旨在实现4K分辨率的图像生成。PixArt-sigma采用了弥散Transformer进行弱到强训练，从能够更好地生成高质量的4K分辨率图像。在应用方面，PixArt-Σ是一款强大的文本到图像生成工具，具有广泛的应用场景，可以满足艺术、设计、游戏开发、营销

PixArt-sigma AI头条

今日大家都在搜的词：

热文

3 天
7天

新AI图像分割方法GenSAM：一个提示实现批量图片分割

今日大家都在搜的词：

热文

站长商机