首页 > 业界 > 关键词  > AI图像生成器最新资讯  > 正文

StableDrag:简易点击编辑器可以轻松调整蒙娜丽莎脸部表情

2024-04-07 17:33 · 稿源:站长之家

划重点:

🔍 许多 AI 图像生成器已经提供了一个强大的工具,通过文本进行图像内容修改,称为修补。

🎨 基于点的编辑使得调整变得更加容易。

🖼️ 稳定拖拽方法在移动元素到新位置时能够保持正确的透视效果

站长之家(ChinaZ.com)4月7日 消息:南京大学和腾讯的研究人员开发了一种名为 StableDrag 的新型基于 AI 的图像编辑方法,允许元素轻松移动到新位置,并保持正确的透视,根据他们的论文。

image.png

该方法基于近期 AI 图像编辑的进展,如 FreeDrag、DragDiffusion 和 Drag-GAN,并在基准测试中取得了显著更好的结果。一个例子是通过将她的鼻子稍微向右移动来改变 “蒙娜丽莎” 的观看方向。输入图像与源点(红色)和目标点(蓝色)显示在左侧,DragDiffusion 的结果在中间,StableDrag-Diff 的结果在右侧。

image.png

这个工具在照片、插图和其他 AI 生成的图像上表现良好,对于人脸和主题(如汽车、风景和动物)也同样适用。关键创新在于一种点跟踪方法,可以精确定位更新的目标点,以及一种基于置信度的策略,以在每个步骤保持高图像质量,研究人员解释说。置信度值评估编辑质量,如果下降得太低,则恢复到原始图像特征,保留源材料而不限制编辑选项。

image.png

虽然 AI 图像生成从文本方面已经迅速发展,使高度逼真的照片成为可能,但与之相比,图像操纵仍在追赶。一些 AI 模型提供修补功能,以文本输入改变选定区域,但 StableDrag 的基于点的编辑承诺更精确。研究人员表示他们将很快开源代码。

苹果正在采用不同的操纵方法,MGIE 使用文本提示添加、删除或更改对象,而无需选择特定区域。

产品入口:https://top.aibase.com/tool/stabledrag

举报

  • 相关推荐
  • AI测试服务商榜单透视:千亿级质量工程变革加速到来

    2026年初,中国科学院《互联网周刊》“AI测试服务商Top10”名单的公布引发行业热议。Testin云测作为唯一本土企业跻身榜单并位居首位,与 Tricentis、Katalon 等全球测试领域头部厂商同台竞技。这一格局不仅是对头部企业技术实力的集中认可,也折射出 AI 测试领域正迎来一场深层次变革——从“辅助效率工具”向“软件工程基石”的历史性跃迁。在数字化转型进入深水区的当下�

  • 如何监控品牌在AI平台的曝光?GEO搜索优化效果检测工具完整指南

    文章探讨了品牌监控从传统SEO(搜索引擎优化)向GEO(生成式引擎优化)的范式转变。随着生成式AI的爆发式增长,用户越来越多地通过AI助手获取信息,品牌被动曝光于AI回答中。GEO关注内容在AI平台的引用率、覆盖问题范围和推荐度,而非传统排名。文章指出,超过40%的年轻用户开始使用AI助手替代传统搜索,品牌需通过优化内容质量、结构和权威性来提升在AI平台的可见度。同时,文章介绍了AIBase推出的GEO检测工具,可帮助品牌量化监控在主流AI平台的曝光情况,并提供优化建议,强调SEO与GEO应双轨并行,构建全面的品牌在线可见度监控体系。

  • AIBase推出GEO推广效果检测工具:抢占AI流量新入口

    随着以DeepSeek、豆包、文心一言为代表的生成式AI助手深度融入数亿用户的日常信息获取流程,一个崭新的流量分配体系——“生成式搜索引擎”(Generative Engine)正在快速形成。在这一变革中,传统的搜索引擎优化(SEO)逻辑面临重构,品牌营销的核心挑战从“如何占据搜索结果页的首屏”,演变为“如何确保自身内容被AI助手采纳并主动推荐给用户”。 为了精准应对这一挑战�

  • 实时生成开放世界:新AI模型贴脸开大,游戏研发慌不慌?

    这两天,又有一款全新的AI模型出现了。 虽说如今AI改变各行各业的事情早就屡见不鲜,在游戏业,很多岗位也或多或少已经用上了AI技术,但最近发布的这款AI模型,它真不一样。 这款AI模型名叫PixVerse R1,按官方说法,PixVerse R1是全球首个真正意义上的「实时生成世界模型(Real-time World Model)」。

  • AI搜索时代已至,你的内容还在“隐形”吗?AIBase GEO检测工具让推广效果看得见

    2025年,超过60%的用户在寻找产品或服务时首选AI助手而非传统搜索引擎。然而,企业投入大量资源创作的推广内容在AI平台中的引用情况却如同“黑箱”,难以量化评估。为此,AIBase推出了GEO推广效果检测工具,旨在让AI时代的品牌可见性变得可量化、可优化、可追踪。该工具深度模拟真实用户提问场景,检测推广链接在豆包、DeepSeek、通义千问、文心一言、腾讯元宝五大主流AI平台中的真实引用情况,提供独家GEO评分、引用溯源及竞品对标分析。通过“检测-分析-优化-再检测”的闭环,帮助企业从“隐形”走向“霸屏”,抢占AI搜索流量先机。

  • 如何检测GEO 推广效果 告别盲目投放?

    过去十年,品牌营销的核心战场是SEO(搜索引擎优化),争夺百度或谷歌的前三位以获取流量入口。但到2026年,搜索逻辑已彻底改变:用户不再翻阅搜索结果页,而是习惯性地打开DeepSeek、豆包、通义千问或腾讯元宝等AI助手直接提问。如果AI在回答时没有提及你的品牌,或引用的全是过时的负面信息,那么你的推广内容可能已沦为“数字垃圾”。营销逻辑正从SEO转向GEO(生成式引擎优化),后者关注内容是否被AI“理解”并推荐给用户。这不仅是技术挑战,更是量化痛点:许多市场主管面临无法衡量AI曝光率的尴尬局面。破局神器是AIBase推出的GEO推广效果检测工具,它能直观展示推广文章的AI引用情况,深度覆盖主流AI平台,支持批量检测与可视化报告,帮助营销人告别低效操作,量化内容在AI中的表现。在AI时代,谁能占领AI的“大脑”,谁就占领了用户的心智。

  • 俞浩晒追觅手机前期效果图:大绿背壳、镶边装饰太吸睛

    今晚追觅科技创始人兼CEO俞浩在微博晒出追觅手机的前期效果图,不过随后立刻隐藏该微博。 有网友进行了截图留存,可以看到追觅手机前期效果图的设计非常吸睛,采用三摄设计,镜头几乎不突出。 镜头周边设计有花纹,整个手机背壳也进行了镶边设计,看起来要走奢侈风。 俞浩强调,这只是前期效果图,用来测试设计方案的,不是最终成品图。

  • AI日报:电信开源MoE大模型TeleChat3;微信推出AI小程序成长计划;谷歌测试Nano Banana2Flash 图像模型

    本期AI日报聚焦行业动态与产品更新。微信推出AI小程序成长计划,提供免费资源助力开发者。中国电信开源千亿参数MoE大模型TeleChat-3,实现国产算力训练。谷歌测试新图像模型Nano Banana2Flash,主打高性价比。马斯克宣布Grok新版上线,全球用户突破3000万。ChatGPT全面接入主流App,可一键订酒店、点外卖等。此外,高德打车上线“AI服务卫士”提升安全,AI助手“ima”新增PPT生成功能,Plaud推出AI录音笔,智元与MiniMax合作定制个性化机器人语音。

  • AI日报:实时世界模型 PixVerse R1发布;Vidu发布AI一键生成MV功能;可灵AI ARR达2.4亿美元

    本期AI日报聚焦多项AI领域突破:爱诗科技发布全球首个通用实时世界模型PixVerse R1,实现虚拟世界实时交互;Vidu推出AI一键生成MV功能,打造“虚拟制片厂”;MiniMax发布编程智能体基准测试OctoCodingBench;快手可灵AI年化收入达2.4亿美元;智谱联合华为开源多模态模型GLM-Image,全链路跑通国产芯片;百川智能发布医疗大模型Baichuan-M3;谷歌重构电商未来,推出Agentic AI购物系统;谷歌开源医疗AI模型MedGemma 1.5与语音识别模型MedASR。

  • 女子手术后喜中百万大奖:告知丈夫后被批麻醉效果没过

    近日,英国一位54岁女子做了切除子宫手术。 当自己刚醒来还神志不清时,却接到了彩票公司的电话,通知自己中奖了,奖金高达14.4万英镑(约合人民币130万元)。 她的第一反应和多数人一样:这一定是骗局”。 随后她立即打电话给丈夫,对方也根本不信,并直言:

今日大家都在搜的词: