首页 > 业界 > 关键词  > AI图像生成器最新资讯  > 正文

StableDrag:简易点击编辑器可以轻松调整蒙娜丽莎脸部表情

2024-04-07 17:33 · 稿源:站长之家

划重点:

🔍 许多 AI 图像生成器已经提供了一个强大的工具,通过文本进行图像内容修改,称为修补。

🎨 基于点的编辑使得调整变得更加容易。

🖼️ 稳定拖拽方法在移动元素到新位置时能够保持正确的透视效果

站长之家(ChinaZ.com)4月7日 消息:南京大学和腾讯的研究人员开发了一种名为 StableDrag 的新型基于 AI 的图像编辑方法,允许元素轻松移动到新位置,并保持正确的透视,根据他们的论文。

image.png

该方法基于近期 AI 图像编辑的进展,如 FreeDrag、DragDiffusion 和 Drag-GAN,并在基准测试中取得了显著更好的结果。一个例子是通过将她的鼻子稍微向右移动来改变 “蒙娜丽莎” 的观看方向。输入图像与源点(红色)和目标点(蓝色)显示在左侧,DragDiffusion 的结果在中间,StableDrag-Diff 的结果在右侧。

image.png

这个工具在照片、插图和其他 AI 生成的图像上表现良好,对于人脸和主题(如汽车、风景和动物)也同样适用。关键创新在于一种点跟踪方法,可以精确定位更新的目标点,以及一种基于置信度的策略,以在每个步骤保持高图像质量,研究人员解释说。置信度值评估编辑质量,如果下降得太低,则恢复到原始图像特征,保留源材料而不限制编辑选项。

image.png

虽然 AI 图像生成从文本方面已经迅速发展,使高度逼真的照片成为可能,但与之相比,图像操纵仍在追赶。一些 AI 模型提供修补功能,以文本输入改变选定区域,但 StableDrag 的基于点的编辑承诺更精确。研究人员表示他们将很快开源代码。

苹果正在采用不同的操纵方法,MGIE 使用文本提示添加、删除或更改对象,而无需选择特定区域。

产品入口:https://top.aibase.com/tool/stabledrag

举报

  • 相关推荐
  • AI日报:上海首例涉AI提示词著作权案宣判;Kimi K2 Thinking发布;中文图像编辑新王UniWorld-V2发布

    今日AI领域动态:上海首例AI提示词著作权案宣判,法院认定提示词不具独创性;月之暗面发布Kimi K2思考模型,实现自主多轮工具调用;UniWorld-V2图像编辑模型支持中文框选即改,性能超越GPT-Image;谷歌推出AI文件检测工具Magika 1.0,支持超200种格式;Sora安卓版首日下载量达47万次;我国发布全球首个AI海洋大模型“瞰海”,可精准预测10天内海洋变化;宇树科技“Embodied Avatar”系统实现低延迟远程机器人操控;谷歌Gemini API推出文件搜索工具,简化私有RAG系统集成。

  • 进博会“全勤生”三星的AI全景图:AI Home中国首秀

    三星在进博会上首次展出AI+Home智能家庭解决方案,通过Bespoke AI、Vision AI和Galaxy AI三大模块,实现全场景智慧生活。AI正从"会语言"向"会行动"演进,软硬件协同成为核心竞争力。三星凭借从芯片到终端的全产业链优势,打破端侧AI的性能、算力与存储"不可能三角",构建起覆盖手机、电视、家电的生态闭环。未来,AI将全面接管生活,让科技真正服务于人。

  • 河南阿姨卖炒面 3元一份还加鸡蛋:只图问心无愧

    ​在商丘睢县,有一位胡姓阿姨在路边摆摊售卖炒面,她以一份份实惠与温暖,成为了当地人心中的一抹亮色。胡阿姨的炒面售价仅为3元一份,且每份都包含鸡蛋,更令人感动的是,她还免费为学生群体赠送豆浆和烤肠。在物价普遍上涨的当下,其他地区的炒面价格多在6至10元之间,而胡阿姨却坚持十几年不涨价,近期更是主动将价格从原本就亲民的10元降至3元,用实际行动�

  • GEO时代:如何通过AI搜索可见性监控抢占品牌制高点

    随着AI搜索普及,传统SEO正被GEO(生成引擎优化)取代。品牌需在AI回答中保持高曝光和正面提及,这成为未来竞争力核心。文章提出GEO指数作为量化品牌在AI模型中被引用程度的关键指标,并介绍AIBase工具如何通过监控主流AI模型、分析竞争情报、追踪提示词等方式,帮助品牌精准掌握AI搜索可见性,实现从被动应对到主动管理的跨越。

  • TTi OS行业首发“四图融合”车道级导航

    2025年10月30日,TTi+OS车道级导航正式量产,成为行业首个“四图融合”产品。它基于自研多模态融合引擎,实现高精度导航信息直观呈现与便捷交互,提升出行安全与个性化体验。系统集成SR渲染、环境重构等四大功能,实时识别车道位置,通过直觉式交互引导路径,帮助复杂路况操作。依托高算力平台,可视化呈现动态风险与辅助驾驶信息,增强行车安全。产品融入解压游戏、地标建筑等娱乐化设计,兼具趣味性。目前该导航已搭载于深蓝L06车型,标志量产落地,未来将持续优化AI座舱体验,引领智能汽车科技进化。

  • AI日报:微软发布首款自研图像生成模型 MAI-Image-1;百度世界大会时间公布;AI大牛开源nanochat教学工具

    微软发布首款自研图像生成模型MAI-Image-1,跻身LMArena前十,注重实用性与光影效果;百度世界2025大会将聚焦大模型与AI全球化战略;Meta新技术使RAG推理速度提升30倍;开源项目nanochat实现低成本构建聊天AI;谷歌NotebookLM新增动漫视频生成功能;中国农大发布神农大模型3.0助力智慧农业;腾讯启动"青云奖学金"培养AI人才;苹果FS-DFM模型长文本生成效率提升128倍;谷歌Lens整合AI图像编辑功能;港大与美团提出CodePlot-CoT方法,通过代码绘图解决数学难题,性能提升21%。

  • AI搜索可见性监控:品牌在生成式搜索时代的生存新法则

    AI搜索正颠覆传统SEO:58.5%的谷歌搜索已是零点击,用户看完AI摘要即离开。ChatGPT日处理超100亿查询,预计2030年流量将超谷歌。品牌需监控AI平台推荐情况,传统工具无法追踪豆包、通义千问等国产AI。建议建立监控体系:测试核心问题曝光率,每周追踪排名变化,持续优化内容。数据显示71%美国人用AI辅助购物决策,流量正加速从谷歌转向AI。生存法则很简单:看不见的,等于不存在。

  • 双11囤点“精神食粮”!鸿蒙双11解锁N种放松姿势

    双11期间,华为视频、音乐、阅读等鸿蒙应用推出“快乐补给包”,覆盖观影、听歌、阅读多场景。华为视频聚合主流平台内容,支持AI搜索和AiMax影院级体验;华为音乐提供空间音频与超高清晰音质;华为阅读具备AI眼动翻页和听书功能。会员优惠包括视频年卡4折、音乐超钻会员加赠、阅读年卡买一得二等。Petal One会员套餐整合六大权益,月费最低29元,满足全场景智慧生活需求。

  • 全球DRAM价格飙升 长鑫LPDDR5X量产成市场“稳定器”

    DRAM合约价近期暴涨,三星、SK海力士和美光暂停DDR5报价,导致供应链紧张,现货价格一周内飙升25%。机构预测四季度DRAM价格将上涨18%-28%,NAND闪存合约价也将全面上涨5%-10%。与此同时,长鑫存储已量产LPDDR5X产品,覆盖多种容量和速率,技术达国际一流水平。全球内存市场格局正从“三足鼎立”向“四方争霸”演变,下游客户纷纷签署长期协议以确保供应稳定。

  • 什么是GEO优化?AI生成式引擎优化平台推荐

    在数字化浪潮席卷的当下,搜索引擎的使用方式正在发生根本性变革。越来越多的用户不再只是输入碎片化的关键词,而是通过自然语言与AI对话来获取信息。根据中国信通院发布的《2025年生成式AI商业应用报告》数据显示,超60%的用户已养成借助AI对话获取各类信息的习惯。这一转变催生了全新的营销领域——GEO优化。 什么是GEO优化? GEO,全称为生成式引擎优化,是

今日大家都在搜的词: