StableDrag：简易点击编辑器可以轻松调整蒙娜丽莎脸部表情

2024-04-07 17:33 · 稿源：站长之家

划重点:
🔍 许多 AI 图像生成器已经提供了一个强大的工具，通过文本进行图像内容修改，称为修补。
🎨 基于点的编辑使得调整变得更加容易。
🖼️ 稳定拖拽方法在移动元素到新位置时能够保持正确的透视效果。

站长之家（ChinaZ.com）4月7日消息:南京大学和腾讯的研究人员开发了一种名为 StableDrag 的新型基于 AI 的图像编辑方法，允许元素轻松移动到新位置，并保持正确的透视，根据他们的论文。

该方法基于近期 AI 图像编辑的进展，如 FreeDrag、DragDiffusion 和 Drag-GAN，并在基准测试中取得了显著更好的结果。一个例子是通过将她的鼻子稍微向右移动来改变 “蒙娜丽莎” 的观看方向。输入图像与源点（红色）和目标点(蓝色)显示在左侧，DragDiffusion 的结果在中间，StableDrag-Diff 的结果在右侧。

这个工具在照片、插图和其他 AI 生成的图像上表现良好，对于人脸和主题（如汽车、风景和动物）也同样适用。关键创新在于一种点跟踪方法，可以精确定位更新的目标点，以及一种基于置信度的策略，以在每个步骤保持高图像质量，研究人员解释说。置信度值评估编辑质量，如果下降得太低，则恢复到原始图像特征，保留源材料而不限制编辑选项。

虽然 AI 图像生成从文本方面已经迅速发展，使高度逼真的照片成为可能，但与之相比，图像操纵仍在追赶。一些 AI 模型提供修补功能，以文本输入改变选定区域，但 StableDrag 的基于点的编辑承诺更精确。研究人员表示他们将很快开源代码。

苹果正在采用不同的操纵方法，MGIE 使用文本提示添加、删除或更改对象，而无需选择特定区域。

产品入口：https://top.aibase.com/tool/stabledrag

（举报）

相关推荐

关键词：

荐AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发布；中文图像编辑新王UniWorld-V2发布

今日AI领域动态：上海首例AI提示词著作权案宣判，法院认定提示词不具独创性；月之暗面发布Kimi K2思考模型，实现自主多轮工具调用；UniWorld-V2图像编辑模型支持中文框选即改，性能超越GPT-Image；谷歌推出AI文件检测工具Magika 1.0，支持超200种格式；Sora安卓版首日下载量达47万次；我国发布全球首个AI海洋大模型“瞰海”，可精准预测10天内海洋变化；宇树科技“Embodied Avatar”系统实现低延迟远程机器人操控；谷歌Gemini API推出文件搜索工具，简化私有RAG系统集成。

AI 著作权提示词
进博会“全勤生”三星的AI全景图：AI Home中国首秀

三星在进博会上首次展出AI+Home智能家庭解决方案，通过Bespoke AI、Vision AI和Galaxy AI三大模块，实现全场景智慧生活。AI正从"会语言"向"会行动"演进，软硬件协同成为核心竞争力。三星凭借从芯片到终端的全产业链优势，打破端侧AI的性能、算力与存储"不可能三角"，构建起覆盖手机、电视、家电的生态闭环。未来，AI将全面接管生活，让科技真正服务于人。

端侧AI AI Home
河南阿姨卖炒面 3元一份还加鸡蛋：只图问心无愧

在商丘睢县，有一位胡姓阿姨在路边摆摊售卖炒面，她以一份份实惠与温暖，成为了当地人心中的一抹亮色。胡阿姨的炒面售价仅为3元一份，且每份都包含鸡蛋，更令人感动的是，她还免费为学生群体赠送豆浆和烤肠。在物价普遍上涨的当下，其他地区的炒面价格多在6至10元之间，而胡阿姨却坚持十几年不涨价，近期更是主动将价格从原本就亲民的10元降至3元，用实际行动�

商丘睢县胡阿姨炒面 3元炒面
GEO时代:如何通过AI搜索可见性监控抢占品牌制高点

随着AI搜索普及，传统SEO正被GEO（生成引擎优化）取代。品牌需在AI回答中保持高曝光和正面提及，这成为未来竞争力核心。文章提出GEO指数作为量化品牌在AI模型中被引用程度的关键指标，并介绍AIBase工具如何通过监控主流AI模型、分析竞争情报、追踪提示词等方式，帮助品牌精准掌握AI搜索可见性，实现从被动应对到主动管理的跨越。

GEO AI搜索品牌曝光
TTi OS行业首发“四图融合”车道级导航

2025年10月30日，TTi+OS车道级导航正式量产，成为行业首个“四图融合”产品。它基于自研多模态融合引擎，实现高精度导航信息直观呈现与便捷交互，提升出行安全与个性化体验。系统集成SR渲染、环境重构等四大功能，实时识别车道位置，通过直觉式交互引导路径，帮助复杂路况操作。依托高算力平台，可视化呈现动态风险与辅助驾驶信息，增强行车安全。产品融入解压游戏、地标建筑等娱乐化设计，兼具趣味性。目前该导航已搭载于深蓝L06车型，标志量产落地，未来将持续优化AI座舱体验，引领智能汽车科技进化。

车道级导航四图融合 TTi
AI日报：微软发布首款自研图像生成模型 MAI-Image-1；百度世界大会时间公布；AI大牛开源nanochat教学工具

微软发布首款自研图像生成模型MAI-Image-1，跻身LMArena前十，注重实用性与光影效果；百度世界2025大会将聚焦大模型与AI全球化战略；Meta新技术使RAG推理速度提升30倍；开源项目nanochat实现低成本构建聊天AI；谷歌NotebookLM新增动漫视频生成功能；中国农大发布神农大模型3.0助力智慧农业；腾讯启动"青云奖学金"培养AI人才；苹果FS-DFM模型长文本生成效率提升128倍；谷歌Lens整合AI图像编辑功能；港大与美团提出CodePlot-CoT方法，通过代码绘图解决数学难题，性能提升21%。

AI 图像生成微软
AI搜索可见性监控：品牌在生成式搜索时代的生存新法则

AI搜索正颠覆传统SEO：58.5%的谷歌搜索已是零点击，用户看完AI摘要即离开。ChatGPT日处理超100亿查询，预计2030年流量将超谷歌。品牌需监控AI平台推荐情况，传统工具无法追踪豆包、通义千问等国产AI。建议建立监控体系：测试核心问题曝光率，每周追踪排名变化，持续优化内容。数据显示71%美国人用AI辅助购物决策，流量正加速从谷歌转向AI。生存法则很简单：看不见的，等于不存在。
双11囤点“精神食粮”！鸿蒙双11解锁N种放松姿势

双11期间，华为视频、音乐、阅读等鸿蒙应用推出“快乐补给包”，覆盖观影、听歌、阅读多场景。华为视频聚合主流平台内容，支持AI搜索和AiMax影院级体验；华为音乐提供空间音频与超高清晰音质；华为阅读具备AI眼动翻页和听书功能。会员优惠包括视频年卡4折、音乐超钻会员加赠、阅读年卡买一得二等。Petal One会员套餐整合六大权益，月费最低29元，满足全场景智慧生活需求。

双11购物智能家电秋冬新装
什么是GEO优化？AI生成式引擎优化平台推荐

在数字化浪潮席卷的当下，搜索引擎的使用方式正在发生根本性变革。越来越多的用户不再只是输入碎片化的关键词，而是通过自然语言与AI对话来获取信息。根据中国信通院发布的《2025年生成式AI商业应用报告》数据显示，超60%的用户已养成借助AI对话获取各类信息的习惯。这一转变催生了全新的营销领域——GEO优化。什么是GEO优化? GEO，全称为生成式引擎优化，是

GEO优化 AI搜索生成式引擎优化
乘风破浪正当时！东鹏饮料稳步打造民族品牌全球供应链新版图

中国功能饮料市场持续扩容，2024年人均年消费量仅9.9升，显著低于美日等国，增长潜力巨大。东鹏饮料作为行业龙头，依托全国13个生产基地构建高效供应链网络，其中海南、昆明基地形成辐射东南亚的“双支点”，利用自贸港政策与区位优势加速全球化；中山、天津基地则强化南北市场协同，通过智能化与本地化布局提升供货效率。公司正稳步拓展海外市场，助力民族品牌�

功能饮料市场东鹏饮料消费量增长

今日大家都在搜的词：

热文

3 天
7天

StableDrag：简易点击编辑器可以轻松调整蒙娜丽莎脸部表情

荐AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发布；中文图像编辑新王UniWorld-V2发布

进博会“全勤生”三星的AI全景图：AI Home中国首秀

河南阿姨卖炒面 3元一份还加鸡蛋：只图问心无愧

GEO时代:如何通过AI搜索可见性监控抢占品牌制高点

TTi OS行业首发“四图融合”车道级导航

AI日报：微软发布首款自研图像生成模型 MAI-Image-1；百度世界大会时间公布；AI大牛开源nanochat教学工具

AI搜索可见性监控：品牌在生成式搜索时代的生存新法则

双11囤点“精神食粮”！鸿蒙双11解锁N种放松姿势

什么是GEO优化？AI生成式引擎优化平台推荐

乘风破浪正当时！东鹏饮料稳步打造民族品牌全球供应链新版图

今日大家都在搜的词：

热文

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

OPPO Reno15系列官宣11月10日发布

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

特斯拉股东批准马斯克万亿美元薪酬包

曝折叠屏iPhone配2400万屏下摄像头预计2026年秋亮相

华为鸿蒙智行新款享界S9开启预订：预售价31.8万起

OPPO Find X9 Pro卫星通信版开启预售：6999元

何小鹏再回应机器人里藏真人质疑：现场展示内部结构

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

阿里回应饿了么更名：正处于灰度测试阶段

马斯克称若发现外星人证据就公开

AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

华为Mate70 Air官宣今日开启预售

vivo Y500 Pro官宣11月10日发布：同档首发2亿HP5主摄

站长商机