首页 > 业界 > 关键词  > StableDrag最新资讯  > 正文

图片编辑技术StableDrag发布 拖动锚点即可编辑图像同时保持高质量

2024-03-11 09:46 · 稿源:站长之家

站长之家(ChinaZ.com)3月11日 消息:还记得DragGAN吗?这是一种可以拖动锚点进行图像编辑的技术,但当时代码发布后,由于生成速度慢,且不能自定义外部图片,逐渐被人们淡忘。

但现在,一种新的技术StableDrag出现了,它是基于Diffusion模型的,也能完成类似的拖动锚点编辑图片的功能。如果它的实际效果真的如演示的那样,那图片编辑将变得非常方便。

image.png

项目地址:https://top.aibase.com/tool/stabledrag

自从DragGAN出现以来,基于点的图像编辑引起了显著的关注。最近,DragDiffusion通过将这种拖动技术适配到扩散模型中,进一步推进了生成质量。然而,尽管取得了巨大的成功,但这种拖动方案存在两个主要缺点:不准确的点跟踪和不完整的运动监督,这可能导致拖动效果不理想。

为了解决这些问题,我们设计了一种判别式点跟踪方法和一种基于置信度的潜在增强策略,构建了一个稳定和精确的基于拖动的编辑框架,称为StableDrag。其中,判别式点跟踪方法允许我们精确定位更新的控制点,从而提高长距离操作的稳定性;而基于置信度的潜在增强策略则负责确保优化后的潜在表示在所有操作步骤中都尽可能保持高质量。

得益于这些独特的设计,我们实现了两种类型的图像编辑模型:StableDrag-GAN和StableDrag-Diff。通过在DragBench上进行广泛的定性实验和定量评估,证明了这两种模型能够实现更稳定的拖动性能。

举报

  • 相关推荐
  • 鸿蒙微信1.0.7.16开启邀测升级:支持管理黑名单、图片发送前编辑

    鸿蒙微信1.0.7.16(1050384)版本开启邀测升级,测试时间为2025/5/26-2025/6/25,需收到短信通知后点击链接跳转安装,无法主动下载安装。 这次升级功能更加完善,新增了包括管理通讯录黑名单、图片发送前支持编辑、置顶聊天支持折叠等实用功能。

  • 如何用DeepSeek生成高质量的竞品SWOT分析报告

    本教程介绍如何利用DeepSeek AI工具快速生成电商平台供应链SWOT分析报告。以京东vs拼多多为例,通过输入指定指令,AI可自动生成包含优势、劣势、机会和威胁四个维度的结构化分析报告,重点突出两者供应链能力差异。操作流程包括:1)登录DeepSeek官网进入对话界面;2)输入SWOT分析指令;3)获取AI生成结果。该方法能显著提升商业分析效率,建议结合最新行业数据对报告进�

  • 小赢卡贷:数字金融赋能实体经济高质量发展

    小赢卡贷深耕湾区沃土,通过"科技+金融"创新模式服务小微企业。其自主研发智能风控系统,构建多维风险评估模型,解决小微企业信用评估难题;开发差异化信贷产品,实现全流程数字化服务;通过科技降本增效,提供普惠利率。目前累计服务超百万湾区小微企业和个体工商户,成为区域经济重要推手。未来将持续加强AI、区块链等前沿技术研发,探索跨境金融、绿色金融等创新业务,深化产学研合作培育数字人才,助力大湾区金融科技高地建设,以科技赋能实体经济高质量发展。

  • 埃克塞尔集团携手孝南区共绘算力经济新蓝图——“数智创新 算力未来”主题活动助推区域高质量发展

    2025年5月21日,中国智能计算产业联盟等单位在孝南区举办"数智创新+算力未来"专家座谈会。会议围绕算力经济发展展开讨论,重点包括:1)孝南区正加速布局3D专用超算中心,推动算力向"水电化"方向发展;2)专家建议构建分布式算力网络应对国际竞争,探索"东数西算"本地化路径;3)孝南区依托纸卫品、食品等"2+2"主导产业优势,计划建设适配型智算中心;4)埃克塞尔集团表示将推动算力技术与本地光电子等产业深度融合。会议达成多项合作共识,将共同推进智算产业园区规划建设,助力湖北算力经济高质量发展。

  • 月访问量超千万的AI图片产品,如何炼成

    作为与 AI 最容易产生化学反应的图片行业,在 AIGC 来临后最早起势,但同样面临竞争激烈、产品同质化等挑战,而在如今图片编辑细分方向几乎处于横盘的状态下,这类产品前路如何、团队如何维系用户基础、又怎样探索新的增长机会?在上个月的 GTC 全球流量大会上,我

  • 如何用DeepSeek快速起草高质量商务合作邮件

    本文介绍如何利用DeepSeek AI快速生成专业商务合作邀约邮件。传统邮件撰写耗时费力,而通过该工具只需四步:1)登录官网输入指令;2)提供合作对象、内容等关键信息;3)AI自动生成结构清晰、措辞专业的邮件草稿;4)复制到邮箱发送或下载存档。该工具能显著提升商务沟通效率,特别适合需要频繁进行业务往来的职场人士,支持个性化调整并保留专业度,是现代化办公的高效解决方案。(139字)

  • 荣膺四项殊荣!安凯客车以创新实力引领商用车高质量发展

    安凯客车在"运输新生态高质量发展论坛暨2025中国商用车品牌营销盛典"上斩获四项行业殊荣,包括"重大赛事交通服务突出贡献单位"和"服务金口碑称号"两项服务类奖项,以及旗下N12豪华公路客车获"公路热销车型"、E12S双层观光巴士获"旅游金口碑称号"产品类奖项。N12凭借卓越品质批量交付新疆、山东等地高端旅游市场,并出口沙特;E12S创新文旅融合模式,已在北京、上海等城市及欧美多国投入运营。安凯以"精准响应、高效处理"服务理念构建全国服务网络,连续五届获服务品牌殊荣,并圆满完成北京奥运会等重大国事交通保障任务。未来将持续以"绿智赋能"为驱动,推动中国客车全球化发展。

  • AI日报:通义千问开源Qwen3向量模型;字节跳动图像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

    本文汇总了近期AI领域的重要动态:1)通义千问发布Qwen3-Embedding系列模型,在多语言文本处理表现优异;2)字节跳动推出图像编辑模型SeedEdit3.0,提升细节保持能力;3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha;4)Anthropic推出面向国家安全的Claude Gov模型;5)可灵AI月收入连续两月超1亿元;6)Meta公布智能眼镜Aria Gen2技术细节;7)爱诗科技上线AI视频工具"拍我AI";8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

  • 每日互动:进一步开发数据要素价值 推动城市交通高质量发展

    浙江省数据局于2025年6月4日公告,浙江云通达数达科技成为省内首批省级公共数据授权运营单位,将开展"数智绿波"场景应用。该公司自2022年进入智慧交通领域,已在34个地区落地645条数智绿波带,使道路通行效率提升超20%。此次授权将推动其在规划建设、优化管理等方面持续发力,并通过数据API与科研单位等开展二次创新,赋能智能网联汽车"车路云一体化"项目建设。该授权是对公司在数据安全、技术能力等方面的认可,未来将继续深化数据融合与场景探索,助力城市交通高质量发展。(140字)

  • 唐煦数畅以全链路数据服务赋能数字经济高质量发展

    在数字经济成为国家战略核心的背景下,数据要素作为新型生产要素的价值日益凸显。国内领先的数据服务商唐照数畅发布"数据要素全链路服务解决方案",覆盖数据采集、治理、流通、应用全生命周期服务,助力政企客户释放数据价值。公司依托自主技术构建数据要素全链路服务生态,为金融、政务、医疗等领域提供数据支撑。方案包含五大核心服务:数据托管与治理、数据产品开发、数据确权交易、数据资产金融服务及数据安全存储。唐照数畅坚持"技术+合规"双轮驱动,通过隐私计算等技术保障数据安全流通,已服务2000余家政企客户,促成数据资产交易超20亿元。未来将持续完善数据要素服务生态,推动数字经济高质量发展。