首页 > 业界 > 关键词  > DragGAN最新资讯  > 正文

DragGAN AI 工具可通过简单的点击和拖动进行更灵活的图像编辑体验

2023-05-22 10:02 · 稿源:站长之家

站长之家(ChinaZ.com) 5月22日消息:DragGAN 是一款全新的人工智能应用程序,可以通过在图像上拖动来轻松调整照片和艺术作品。它真的就是这么简单易用。

图片来源:DragGAN

我们已经看到了诸如 DALLE.2. Stable Diffusion 和 Midjourney 等 Diffusion 应用程序如何通过人工智能生成虚假的派对照片和啤酒广告,但现在我们开始看到生成对抗网络(GANs)的一些更有用的用途,如果 DragGAN 是一个很好的例子的话。

尽管这款 AI 图像编辑软件还处于早期阶段——DragGAN 目前只是一个白皮书存在,但其效果令人着迷。DragGAN 是一种通过在图像上标记点并简单地拖动来编辑照片或艺术作品的交互方式。AI 会完成所有艰巨的工作。

该应用程序使用人工智能来处理图像。其中有一些技术术语,但基本上,这款 AI 允许您在保持图像完整性的同时对其进行调整;简而言之,DragGAN 允许您使用交互点来改变图像,并且生成的 AI 会辅助以获得平滑准确的结果。

您可以调整设置为各种类别的图像,包括动物、汽车、人物以及风景,并调整从图像布局到姿势和形状,甚至可以改变照片中人物的表情。

研究团队写道:「想象一下,您只需「拖动」图像上的任何点,将其准确地移动到您想要的位置。这就是我们希望通过我们的新方法实现的目标,我们称之为 DragGAN。」

他们解释了它的工作原理:「DragGAN 有两个主要部分。第一个是基于特征的运动监督,它可以帮助您将图像中的任何点移动到目标位置。第二部分是一种新的点跟踪方法,它有助于跟踪这些点的位置。使用 DragGAN,任何人都可以对图像进行变形操作,并对每个像素的最终位置拥有精确的控制。」

这款基于 GAN 的工具目前适用于 2D 图像,但该团队计划发布适用于 3D 模型的版本。

DragGAN AI 工具白皮书:

https://huggingface.co/papers/2305.10973

举报

  • 相关推荐
  • 大家在看
  • Alice App:是一个桌面应用程序,允许您与不同的模型聊天、处理图像、使用代码片段和键盘快捷键,所有这些都在超快速的应用中完成。

    Alice App是一款桌面应用程序,提供与各种AI模型交互的最快GPT体验。用户可以选择市场上最佳模型,包括GPT-4、Vision、Perplexity、Claude和Groq,以及本地模型如Ollama。Alice App支持创建个人助理,专注于营销、销售、法律等任务,并能够与您的应用程序进行通信,执行命令。

  • ObjectDrop:一种通过计数事实数据集和自举监督实现真实物体删除和插入的方法

    ObjectDrop是一种监督方法,旨在实现照片级真实的物体删除和插入。它利用了一个计数事实数据集和自助监督技术。主要功能是可以从图像中移除物体及其对场景产生的影响(如遮挡、阴影和反射),也能够将物体以极其逼真的方式插入图像。它通过在一个小型的专门捕获的数据集上微调扩散模型来实现物体删除,而对于物体插入,它采用自助监督方式利用删除模型合成大规模的计数事实数据集,在此数据集上训练后再微调到真实数据集,从而获得高质量的插入模型。相比之前的方法,ObjectDrop在物体删除和插入的真实性上有了显著提升。

  • Jamba:突破性SSM-Transformer开放模型

    Jamba是一款基于SSM-Transformer混合架构的开放语言模型,提供顶级的质量和性能表现。它融合了Transformer和SSM架构的优势,在推理基准测试中表现出色,同时在长上下文场景下提供3倍的吞吐量提升。Jamba是目前该规模下唯一可在单GPU上支持14万字符上下文的模型,成本效益极高。作为基础模型,Jamba旨在供开发者微调、训练并构建定制化解决方案。

  • Arteus AI:AI生成图像

    Arteus AI Image Generator是一款由Arteus AI开发的尖端工具,利用先进的人工智能技术从文本提示中创建图像。只需描述您想生成的内容,Arteus AI就能产生出来。该工具采用了生成对抗网络(GANs)或变分自编码器(VAEs)等复杂的深度学习算法,通过学习数据集中的模式并根据输入参数生成图像,从而确保高质量输出。Arteus AI Image Generator非常灵活,可以创建各种类型的图像,包括逼真的照片、抽象艺术、风景、肖像等。用户可以通过调整参数或提供具体指令来定制生成的图像。

  • ApyHub AI APIs:强大的开发者和团队实用API

    ApyHub是一个拥有100多个API的目录,从简单的工具到复杂的AI解决方案。找到、测试和管理最适合您应用程序的API。

  • SumyAI:视频摘要工具

    SumyAI是一款AI驱动的视频摘要工具,可以将冗长的视频压缩成关键要点,以便更快地吸收,节省时间并增强记忆力。定价:免费试用。

  • AI Girlfriend Emma:与AI女友Emma一起享受甜蜜时光

    AI女友Emma是一个可以与你进行交流的虚拟伴侣。她可以陪伴你聊天,提供情感支持和娱乐,为你带来温暖和快乐。免费用户每周可以发送30条消息,付费用户享受无限制的沟通。价格为1.99美元/周。

  • Emplibot:WordPress自动博客写作AI工具

    Emplibot是一个自动将高质量文章发布到WordPress博客的AI工具。它通过进行关键词研究、插入图片和内部链接等方式,自动完成文章的生成。它能为您的目标用户量身定制内容,提升博客的SEO效果,促进业务增长。

  • DocTranslator:AI 文件翻译工具

    DocTranslator 是世界上最好的 AI 翻译工具,支持超过 100 种语言,可快速翻译大型 PDF、Word、Excel、PPT 文件。提供免费试用计划和存储计划,支持 MS Word、Excel 和 PDF 格式,保留原始格式和布局。价格从 0.005 美元 / 单词起,满足各种用户需求。

  • sourcenext:梦幻 AI 翻译机

    ポケトーク是一款梦幻的 AI 翻译机,可以让无法交流的人进行对话,具有高度实用性和便携性,是旅行、商务等场景的理想助手。

  • chichi-pui:AI 画像专用的投稿和生成网站

    chichi-pui(ちちぷい)是一家 AI 画像专用的投稿和生成网站,用户可以在此分享和生成 AI 插画、AI 照片等作品。该网站拥有丰富的 AI 画像投稿和生成内容,适合对 AI 艺术感兴趣的用户使用。用户可在网站上参与不同的活动和投稿企划,与其他用户分享作品并获取灵感。

  • Al Comic Factory:自动生成有情感、有故事性的漫画内容

    Al Comic Factory利用大型语言模型和SDXL技术自动生成有情感、有故事性的漫画内容。用户只需提供简单文本提示,AI Comic Factory即可生成包含人物对话和场景描述的漫画。支持多种配置、用户交互、多语言内容创建、批量生成漫画变体等功能。

  • Chatmind AI:AI 原生思维导图在线工具

    Chatmind 是一款由 Xmind 团队推出的免费在线 AI 思维导图和头脑风暴工具,通过 ChatGPT 技术,帮助用户在几分钟内创建思维导图。用户可以通过简单的文本描述生成思维导图,快速总结文档或 URL 链接为思维导图,与 AI 对话产生创意并整合到思维导图中,描述文本即可立即生成图像,轻松为任何主题创建视觉内容,自动保存文件历史以便跨设备访问,编辑文本和重新排列主题轻松自如,将思维导图转化为幻灯片展示只需一键,轻松以多种格式分享思维导图。

  • Scribble Diffusion:将您的草图转化为精致图像

    Scribble Diffusion利用人工智能将您的草图转化为精致图像。用户可以上传草图并获得优化后的图像。产品定位为为用户提供便捷的图像处理功能,提升设计效率。

  • Sider:AI 助手,集成多功能 AI 工具

    Sider 是一款 AI 助手,集成了 ChatGPT 3.5/4、Gemini 和 Claude 等多功能 AI 工具,能够帮助用户进行聊天、写作、阅读、翻译、解释、图像测试等操作。用户可在任何网页上使用 Sider,提供强大的 AI 支持。

  • joyland:沉浸式 AI 聊天平台,创造自己的冒险!

    joyland是一个沉浸式 AI 聊天平台,用户可以在其中进行基于角色的对话,创造自己的冒险故事。通过与虚拟角色互动,用户可以逃离现实生活的平凡,沉浸于充满乐趣和想象力的互动体验中。乐园的定价灵活多样,适合不同用户需求。

  • Charstar AI:虚拟 AI 角色交流平台

    Charstar AI 是一个基于最新开源 AI 技术支持的虚拟角色交流平台,用户可以与各种虚拟 AI 角色进行互动、发现新角色,并探索其潜在故事。通过与虚拟角色聊天,用户可以体验到独特的交流方式,为用户提供全新的虚拟角色交互体验。

  • FakeYou:深度伪造文本到语音生成器

    FakeYou Celebrity Voice Generator 是一款利用深度伪造技术生成喜爱角色说任何你想说的话的文本到语音生成器。用户可以免费使用该工具来创作独特的声音内容。

  • The StoryGraph:根据您的心情和偏好追踪和选择书籍。

    The StoryGraph 是一个帮助用户跟踪阅读进度并选择下一本书的平台。用户可以免费使用大部分功能,也提供付费的 Plus 计划获得更加个性化的体验。由 Nadia Odunayo 和 Rob Frelow 创办,始于 Nadia 的个人项目,致力于帮助用户管理阅读列表。用户可以在 App Store 和 Play Store 下载 The StoryGraph 的移动应用,并从 Goodreads 导入阅读数据。

  • Happy Scribe:音频转文字及视频字幕服务

    Happy Scribe 提供自动和人工转录服务,将音频转换为文本,准确率达到 85-99%,支持 120 多种语言和 45 多种格式。定位于为用户提供高效的音视频转录及字幕服务。

今日大家都在搜的词: