首页 > 业界 > 关键词  > StableDrag最新资讯  > 正文

图片编辑技术StableDrag发布 拖动锚点即可编辑图像同时保持高质量

2024-03-11 09:46 · 稿源:站长之家

站长之家(ChinaZ.com)3月11日 消息:还记得DragGAN吗?这是一种可以拖动锚点进行图像编辑的技术,但当时代码发布后,由于生成速度慢,且不能自定义外部图片,逐渐被人们淡忘。

但现在,一种新的技术StableDrag出现了,它是基于Diffusion模型的,也能完成类似的拖动锚点编辑图片的功能。如果它的实际效果真的如演示的那样,那图片编辑将变得非常方便。

image.png

项目地址:https://top.aibase.com/tool/stabledrag

自从DragGAN出现以来,基于点的图像编辑引起了显著的关注。最近,DragDiffusion通过将这种拖动技术适配到扩散模型中,进一步推进了生成质量。然而,尽管取得了巨大的成功,但这种拖动方案存在两个主要缺点:不准确的点跟踪和不完整的运动监督,这可能导致拖动效果不理想。

为了解决这些问题,我们设计了一种判别式点跟踪方法和一种基于置信度的潜在增强策略,构建了一个稳定和精确的基于拖动的编辑框架,称为StableDrag。其中,判别式点跟踪方法允许我们精确定位更新的控制点,从而提高长距离操作的稳定性;而基于置信度的潜在增强策略则负责确保优化后的潜在表示在所有操作步骤中都尽可能保持高质量。

得益于这些独特的设计,我们实现了两种类型的图像编辑模型:StableDrag-GAN和StableDrag-Diff。通过在DragBench上进行广泛的定性实验和定量评估,证明了这两种模型能够实现更稳定的拖动性能。

举报

  • 相关推荐
  • 腾讯云TencentOS提交Swap Table补丁系列 Linux内核内存交换性能提升20%~30%

    腾讯云操作系统团队提交了名为Swap Table的补丁系列,针对Linux内核交换子系统进行优化。该系列在4K页面和mTHP folios场景下,使系统性能提升20%-30%。Swap Table通过智能调度机制优化数据定位,支持大页尺寸减少操作次数,并实现动态空间扩展。27项独立改进解决了历史遗留问题,经实测性能显著提升。目前补丁系列正处于审核阶段,有望纳入Linux内核主线。这是腾讯云团队继内存控制组、页面热管理等创新后,在操作系统核心技术领域的又一突破,将强化TencentOS Server的高性能优势。

  • 3节点集群带宽突破 513GBps 焱融存储再度登顶MLPerf Storage 全球榜单

    2025年8月4日,MLCommons®发布最新MLPerf® Storage v2.0基准测试结果。中国厂商焱融科技的全闪存一体机F9000X表现突出:在3D-Unet模型测试中以三节点存储集群实现513GB/s总带宽,刷新全球纪录;在ResNet50、CosmoFlow等所有模型测试中均领先,登顶性能榜单。新版本新增Checkpoint工作负载测试,覆盖模型存档等实际场景。测试显示F9000X在分布式和单节点场景均表现优异,其中Llama3-70B模型测试

  • 当 Manus 追赶协同赛道,国产MasterAgent多智能体协同已遥遥领先

    8月1日,Manus推出面向Pro用户的新功能Wide Research,月费199美元。该功能虽支持多线程任务处理,但仍需手动设置子代理分工,核心技术依赖海外大模型。相比之下,深圳深元人工智能研发的MasterAgent在多智能体协同领域取得重大突破,实现全栈国产化技术,能自主完成从数据采集到决策的全流程处理。其首创的博弈共识算法可快速解决多Agent决策冲突,并通过领域微调技术打造行业专家级智能体。目前MasterAgent已开启公测,标志着中国AI技术从"跟跑"迈向"领跑"阶段。

  • 苹果iOS 26 Beta 5上线:细节优化 更新内容一览

    控制中心成为此次更新的重点优化区域。页面滑动切换时新增的弹性动画使操作更具连贯性,Wi-Fi模块长按后首次显示网络属性标识——私有网络标注“家庭/办公”字样,公共网络则提示“需谨慎连接”,密码保护状态通过锁形图标直观呈现。灵动岛区域在电量降至20%时,会以红色波浪动画形式弹出低电量警告,取代此前单调的弹窗提示。 视觉设计层面,主屏幕底部的“液态

  • 曝澎湃OS 3最快本月开启Beta版内测:小米16首发

    快科技8月5日消息,博主爆料各厂商将在8月陆续开启下一代操作系统Beta版内测。小米16系列预计9月发布,将搭载澎湃OS 3系统。该系统新增"灵动岛"功能,利用前置摄像头周围区域显示卡片、弹窗等信息,用户无需打开应用即可查看导航、播放进度等内容。此外,澎湃OS 3将升级AI体验,强化"超级小爱"功能,支持文字、语音、图片等多种内容识别及实时对话交互。新系统还优化了智能助手理解力,可处理更复杂的生活场景需求。(140字)

  • Custouch市场易AI技术入选Topdigital2025全球AI营销图谱

    《TopDigital2025全球AI营销图谱》近日发布,Custouch市场易入选"内容智能生成"板块。该图谱为AI技术重构营销提供全链路产业地图,整合企业官网、学术报告、专利库等多维度信息。Custouch凭借AI技术在B2B营销领域的创新应用入选,其智能解决方案能有效满足企业实际需求。作为数字营销技术服务商,Custouch已为300+国际头部企业提供一站式营销管理体系,涵盖内容、活动、线索等全流程,助力企业实现高质量增长。此次入选既是对其AI成果的肯定,也是对其未来发展的激励。

  • 小米15推送HyperOS 2.0 Beta更新:新增长按电源键与超级小爱持续对话功能

    小米昨日晚间面向小米15用户推送了HyperOS 2.0.230.18.WOCCNXM Beta版系统更新,更新包大小约为360MB。本次更新主要针对电源键功能和设备重启体验进行了优化。这也是小米15自从7月3日以来推送的第三版基于安卓16的HyperOS Beta版推送。

  • 文远知行与阿布扎比综合交通中心合作,扩大Robotaxi在阿运营范围

    2025年7月29日,文远知行与Uber合作在阿布扎比推出Robotaxi服务,覆盖阿尔雷姆岛和阿尔马里亚岛等核心区域。这是中东地区规模最大的自动驾驶车队,采用文远知行新一代GXR车型,每车可载5人。服务范围已覆盖阿布扎比近半核心区,包括主要住宅区和商业中心。自2024年12月启动以来,车队规模已增长三倍,日均完成数十次订单。该项目是阿布扎比智能交通战略的重要部分,目标到2040年实现25%公共交通依赖智能出行。合作方表示,这将推动自动驾驶技术在中东地区的主流化应用。

  • 淘宝天下入选《TopDigital2025全球AI营销图谱》

    7月29日,淘宝天下凭借AI服务平台"淘宝AI智+"的创新实践,成功入选《TopDigital2025全球AI营销图谱》"智能分析与决策"赛道。该平台整合淘宝生态数据资源,构建覆盖数据分析、智能营销、内容生成等全链路的AI解决方案体系,通过模块化设计降低使用门槛,帮助商家实现降本增效。平台还提供深度定制开发服务,推动AI能力与业务场景有机融合。此次入选标志着淘宝天下在AI技术创新与商业应用方面的成果获得行业认可。团队表示将持续聚焦AI技术实用价值转化,拓展电商营销领域的创新应用场景。

  • 每日互动全新升级AITA超级营销助手,打造AI时代的品牌营销智能体验

    2025年AI大模型将重塑千行百业,品牌营销领域迎来以"智能体"为核心的效率革命。每日互动升级AITA(AI-Targeting Audience)系统,打造AI超级营销助手,通过"大数据+大模型"双引擎,实现智能洞察、精准策略生成和高效投放对接。该系统突破传统营销的数据局限,支持知识库接入行业智库,提供跨平台人群圈选和智能媒介策略推荐,实现"洞察-圈人-投放"一站式工作流。AITA能持续优化投放效果,确保营销活动始终保持高效精准,助力品牌快速把握市场动态和消费者需求,推动全域智能营销发展。

热文

  • 3 天
  • 7天