首页 > 业界 > 关键词  > Meta最新资讯  > 正文

Meta 推出免费独立的 AI 图像生成器网站「Imagine with Meta AI」

2023-12-07 09:21 · 稿源:站长之家

站长之家(ChinaZ.com) 12 月 7 日消息:在谷歌推出 Gemini 之后,Meta 也不甘示弱,在网络上推出了基于其 Emu 图像合成模型的免费独立 AI 图像生成器网站——Imagine with Meta,允许用户通过自然语言描述来生成图像。

截屏2023-12-07 上午9.19.13.jpg

Imagine with Meta AI 网站截图

Meta 使用了 11 亿张 Facebook 和 Instagram 上公开可见的图片来训练这个 AI 模型,该模型可以根据文本提示渲染新图像。此前,Meta 的这项技术——使用相同的数据——仅在诸如 Instagram 的消息传递和社交网络应用程序中可用。

如果你使用 Facebook 或 Instagram,很可能你的照片(或你拍摄的照片)帮助训练了 Emu。从某种意义上说,老话「如果你不付费,你就是产品」已经有了全新的含义。虽然截至 2016 年,Instagram 用户每天上传超过 9500 万张照片,但 Meta 用来训练其 AI 模型的数据集只是其整体照片库的一小部分。

Meta 表示,它只使用公开可用的照片进行训练,因此将 Instagram 或 Facebook 上的照片设为私有应该可以防止它们被公司未来的 AI 模型训练所包含(当然,除非它改变这一政策)

Imagine with Meta AI

「Imagine with Meta AI」类似于 Stable Diffusion、DALL-E 3 和 Midjourney,根据 AI 模型从训练数据中学到的视觉概念生成新图像。使用这个新网站创建图像需要一个 Meta 帐户,可以从现有的 Facebook 或 Instagram 帐户导入。每次生成会创建四张 1280×1280 像素的图片,可以以 JPEG 格式保存。图片在左下角包含一个小小的「Imagined with AI」水印标志

Meta 在其新闻稿中说:「我们很高兴听到人们分享他们是如何使用 imagine 来制作有趣和富有创意的内容的,imagine 是 Meta AI 的文字转图片生成功能。今天,我们将 imagine 的访问权限扩展到聊天之外,首先在美国推出 imagine.meta.com。这个独立体验面向创意爱好者,让你使用来自 Emu 的技术创造图像。」

Meta 的模型通常可以很好地创建逼真的图像,但不如 Midjourney。它可以处理比 Stable Diffusion XL 更复杂的提示,但也许不如 DALL-E 3。它在文本渲染方面做得并不好,不同媒体输出,如水彩、刺绣和钢笔墨水的处理结果参差不齐。其人物图像似乎包括了不同种族背景的多样性。总的来说,就目前 AI 图像合成而言,它似乎表现一般。

Facebook 和 Instagram 让这一切成为可能

那么,我们对 Emu——Meta 新 AI 图像生成功能背后的 AI 模型——了解多少呢?根据 Meta 在 9 月发布的一篇研究论文,Emu 通过一个称为「质量调整」的过程获得了生成高质量图像的能力。与使用大量图像文本对训练的传统文本到图像模型不同,Emu 在预训练后专注于「美学对齐」,使用一组相对较小但视觉上吸引人的图像

然而,Emu 的核心仍然是前面提到的从 Facebook 和 Instagram 抽取的 11 亿个文本图像对的庞大预训练数据集。在 Emu 的研究论文中,Meta 没有具体说明训练数据来自何处,但 Meta Connect 2023 会议的报道援引 Meta 全球事务总裁尼克·克莱格(Nick Clegg)的话说,他们正在使用社交媒体帖子作为 AI 模型的训练数据,包括输入 Emu 的图像

这是 Meta 与其他 AI 公司的方法不同的地方,因为 Meta 可以访问其服务中的大量图像和标题数据。其他图像合成模型使用从互联网非法抓取的图像、从商业图库获得的许可图像,或两者的组合。

有趣的是,Meta 关于 Emu 的研究论文是我们所见的第一篇关于主要图像合成模型的论文,它没有声明该模型可能创造扭曲现实的虚假信息或潜在有害内容的可能性。这反映了 AI 图像合成模型的普遍接受(或放弃),这些模型现在变得更加普遍。这是否是一件好事是一个悬而未决的问题。

尽管如此,Meta 似乎正在通过过滤器、尚未运作的拟议水印系统(该公司表示:「在未来几周内,我们将为 imagine with Meta AI 体验添加不可见的水印,以提高透明度和可追踪性」)以及网站底部的小声明来处理潜在有害输出的问题:「图片可能是不准确或不恰当的。」

这些图像可能不准确,甚至可能在未命名的 11 亿张用于训练模型的图像作者看来是不道德的。但我们敢说:生成这些图像可能很有趣。当然,根据你的态度以及你对 AI 图像合成速度的看法,这种乐趣可能会被同等程度的关注所抵消。

举报

  • 相关推荐
  • 大家在看
  • ComfyUI-Hallo:一个定制的ComfyUI节点,用于Hallo模型。

    ComfyUI-Hallo是一个为Hallo模型定制的ComfyUI插件,它允许用户在命令行中使用ffmpeg,并从Hugging Face下载模型权重,或者手动下载并放置在指定目录。它为开发者提供了一个易于使用的界面来集成Hallo模型,从而增强了开发效率和用户体验。

  • AI Word Summarizer:AI驱动的文档摘要工具,快速生成文档摘要。

    AI Word Summarizer是一款利用高级人工智能技术快速生成Microsoft Word文档摘要的在线工具。它通过用户友好的在线界面,帮助用户节省时间,提高工作效率。该工具支持将DOCX/DOC格式的文档转换为文本,并在几秒钟内生成摘要。它还提供了与文档对话的功能,允许用户提出问题并获得即时的洞察和澄清。

  • AI Math GPT Solver Powered by GPT-4o:AI驱动的数学问题解决器

    AI Math GPT Solver是一个由GPT-4o提供动力的在线数学问题解决平台,它覆盖了代数、微积分和几何等数学领域,集成了微软数学求解器等领先技术,提供快速、准确的解决方案。该平台通过网页和移动应用程序提供免费、用户友好的服务,允许用户随时随地解决问题。

  • GPT4o.so:革命性AI技术,多模态智能互动

    GPT-4o是OpenAI的最新创新,代表了人工智能技术的前沿。它通过真正的多模态方法扩展了GPT-4的功能,包括文本、视觉和音频。GPT-4o以其快速、成本效益和普遍可访问性,革命性地改变了我们与AI技术的互动。它在文本理解、图像分析和语音识别方面表现出色,提供流畅直观的AI互动,适合从学术研究到特定行业需求的多种应用。

  • 知闻AI:基于AI技术的新闻聚合平台

    知闻AI是一个利用人工智能技术为用户提供高质量新闻内容的新闻聚合平台。它通过分析大量新闻源,筛选出准确、及时的新闻,帮助用户获取有价值的信息。平台特点包括智能评估、多元视角、AI摘要等,以提高用户的阅读效率和信息获取质量。

  • MidJourney Sref Codes Library:探索和标记您喜爱的MidJourney Sref代码。

    MidJourney Sref Codes Library是一个在线资源网站,提供MidJourney平台上的高质量Sref代码集合。这些代码用于生成具有独特和一致风格的图像,为艺术家和创作者提供了实现特定视觉效果的强大工具。

  • Humanize.im:将AI文本转化为自然人类语言。

    Humanize.im是一个先进的AI文本人性化工具,旨在将AI生成的文本转化为更自然、更具吸引力的人类语言。它利用高级算法进行上下文分析和情感分析,确保文本在上下文和情感上适当且一致,同时增强可读性和相关性。该工具支持多语言,具有跨设备功能,并且注重数据安全。Humanize.im通过持续的反馈循环不断改进,以确保生成的文本与人工撰写的文本无异,有效绕过AI检测系统如GPTZero。

  • 免费在线转换文字为语音:将文本转换为逼真语音的在线工具

    该产品是一个先进的在线文字转语音工具,使用人工智能技术将文本转换为自然逼真的语音。它支持多种语言和语音风格,适用于广告、视频旁白、有声书制作等场景,增强了内容的可访问性和吸引力。产品背景信息显示,它为数字营销人员、内容创作者、有声书作者和教育工作者提供了极大的便利。

  • Kling AI:文本到视频的革命性生成模型

    Kling AI是由快手科技开发的文本到视频生成模型,能够根据文本提示生成高度逼真的视频。它具有高效的视频生成能力,长达2分钟的30帧每秒视频,以及3D时空联合注意机制和物理世界模拟等先进技术,使其在AI视频生成领域具有显著的竞争优势。

  • LocalhostAI:与Chrome和Gemini Nano无缝协作的AI助手。

    LocalhostAI是一款旨在提高用户生产力的AI助手应用。它与Chrome浏览器和Gemini Nano设备紧密集成,使用户能够利用先进的AI模型来提升工作效率。该产品的主要优势在于其内置的Chrome AI模型、支持离线使用、注重隐私保护、运行速度快且完全免费。

  • TravelTrail:智能旅行规划助手,轻松管理你的旅程。

    TravelTrail是一款旅行规划应用,通过人工智能技术帮助用户创建和组织旅行计划。它允许用户保存梦想目的地的列表,探索每个城市的详细信息,并根据个人喜好定制旅行体验。应用支持多语言,包括中文、英文等,为用户提供了便捷的旅行规划工具,无需担心语言障碍。

  • i18nlocale:AI驱动的多语言翻译工具,本地化且易于使用。

    Local + Effortless i18n Translation是一个AI驱动的翻译工具,支持200多种语言的本地化翻译,不接触服务器,与JSON格式无缝集成。它提供了一次性购买的可负担价格,并且提供免费试用,以帮助企业轻松实现多语言内容的本地化。

  • AI Content Mate:AI驱动的Figma插件,实现文本的智能替换。

    AI Content Mate是一个Figma插件,它通过AI技术帮助用户在设计中自动选择和替换文本。它能够理解文本的上下文,提供智能且相关的替代选项,同时允许用户添加自定义的注释和指南以确保生成的文本符合特定需求。这个插件提供了免费访问,通过Grok-cloud API密钥,用户可以享受AI驱动的文本转换功能,无需任何成本。

  • ReelGen:AI驱动的内容生成平台,轻松创造高质量播客和博客。

    ReelGen是一个利用先进人工智能技术的内容生成平台,旨在帮助用户轻松创建高质量的播客和博客文章。用户无需具备技术技能,通过ReelGen的用户友好界面,几分钟内即可开始创作。平台提供定制化服务,允许用户根据品牌的声音和风格调整内容,从音频质量到文本转语音的细节,确保内容与用户愿景相匹配。ReelGen专注于内容生产,让用户专注于创作,而将生产过程中的重活交给平台,从而在不牺牲质量的前提下,用更少的时间生产更多的内容。

  • AI Reveals:使用AI技术创造惊人的标志动画。

    AI Reveals是一个利用人工智能技术,帮助用户创建动态标志动画的在线工具。它通过用户上传的透明背景标志图片,自动生成具有吸引力的动画效果,增强品牌形象和市场竞争力。该技术的主要优点包括操作简便、效果多样、实时预览等,适合需要快速制作高质量动画的设计师和企业。

  • ChatGPT Folder Master:组织和保存重要ChatGPT对话的终极工具。

    ChatGPT Folder Master 是一款专为Chrome浏览器设计的插件,旨在帮助用户高效地组织和保存与ChatGPT的对话。它通过文件夹和子文件夹系统,让用户能够轻松地对对话进行分类和存档,确保重要信息不会丢失。产品界面友好,易于导航和使用,同时提供安全的本地存储,确保用户对话的隐私和安全。此外,该插件提供月度和终身订阅计划,满足不同用户的需求。

  • Thousand Brains Project:探索大脑智能的AI项目

    Thousand Brains Project是由Jeff Hawkins和Numenta公司发起,旨在通过理解大脑新皮层的工作原理来开发新型的人工智能系统。该项目基于Thousand Brains Theory of Intelligence,提出了与传统AI系统根本不同的大脑工作原理。项目的目标是构建一种高效且强大的智能系统,能够实现人类所具备的智能能力。Numenta公司开放了其研究资源,包括会议记录、代码开源,并建立了一个围绕其算法的大型社区。该项目得到了盖茨基金会等的资金支持,并鼓励全球研究人员参与或加入这一激动人心的项目。

  • Plansom:AI驱动的项目管理工作助手,提升效率。

    Plansom是一款AI驱动的项目管理应用程序,旨在通过简化复杂任务来实现运营卓越。它利用AI技术帮助用户快速创建详细的商业计划,智能分析并优先排序任务,提供AI辅助以解决复杂任务,并支持团队协作和实时跟踪团队进展。用户可以自定义策略模板,以确保组织内的一致性和效率。

  • Xterminal:更高效的开发工具,SSH/控制台/更多功能集成。

    Xterminal是一款集成了SSH、本地控制台、AI赋能命令提示等功能的高效开发工具,旨在为开发者提供更便捷的开发环境。它支持多种操作系统,包括Windows、macOS和Linux,拥有免安装版本和兼容旧版系统的版本,满足不同用户的需求。

  • NIPRGPT:美国空军推出的AI聊天机器人

    NIPRGPT是美国空军为现代化努力的一部分,由空军首席信息官与空军研究实验室合作,加速提供给守护者、空军人员、文职员工和承包商一个负责任地实验生成性人工智能(Generative AI)的平台,同时确保有适当的安全措施。这个平台允许用户进行类似人类的对话以完成各种任务,是一个在安全计算环境中可以回答问题和协助处理通信、背景文件和代码的CAI工具。

今日大家都在搜的词: