OpenAI 发布 DALL-E 3 文生图模型：与 ChatGPT 完全集成在细节和提示保真度方面挑战极限

2023-09-21 08:55 · 稿源：站长之家

站长之家(ChinaZ.com) 9月21日消息:本周三，OpenAI 宣布了 DALL-E 3，这是其最新版本的 AI 图像合成模型，它与 ChatGPT 完全集成。

OpenAI，ChatGPT，人工智能，AI

DALL-E 3 通过紧密遵循复杂的描述并处理图像内文本生成（如标签和标志）来渲染图像，这是早期模型所面临的挑战。目前处于研究预览阶段，将于十月初提供给 ChatGPT Plus 和企业客户。

与其前身一样，DALL-E 3 是一种文本到图像生成器，根据称为提示的书面描述创建新颖的图像。尽管 OpenAI 没有透露关于 DALL-E 3 的技术细节，但以前版本的 DALL-E 的核心 AI 模型是基于由人类艺术家和摄影师创作的数百万张图像进行训练的，其中一些是从像 Shutterstock 这样的库网站获得许可的。DALL-E 3 很可能也遵循了这一相同的方法，但使用了新的训练技术和更多的计算训练时间。

从 OpenAI 在其宣传博客上提供的示例来看，DALL-E 3 似乎是迄今为止可用于按提示操作的图像合成模型中的一个巨大突破。尽管 OpenAI 的示例是精选的，以展示其效果，但它们似乎忠实地遵循了提示的指令，并以无需任何「黑科技」或提示工程即可令对象逼真地呈现出来。

与 DALL-E 2 相比，OpenAI 表示 DALL-E 3 能够更有效地细化手部等小细节，从而默认情况下创建引人入胜的图像。

相比之下，来自另一竞争对手供应商 Midjourney 渲染了逼真的细节，但仍然需要对提示进行大量反直觉的调整才能控制图像输出。

DALL-E 3 似乎还可以处理图像中的文本，而其前身无法做到这一点（一些竞争模型，如 Stable Diffusion XL 和 DeepFloyd，在这方面表现得越来越好）。例如，包含「一幅画中，一个鳄梨坐在治疗师椅子上，说着『我感到内心空虚』，中间有一个坑孔大小的洞」的提示，创建了一个卡通鳄梨，角色的台词完美地被包含在一个对话气泡中。

图片来自OpenAI

值得注意的是，OpenAI 表示 DALL-E 3 是「在 ChatGPT 上本地构建」的，并将作为 ChatGPT Plus 的一个集成功能推出，使 AI 助手能够作为头脑风暴的合作伙伴以一种与当前对话的背景相一致的上下文环境方式生成图像。这可能会带来新的能力。微软的 Bing Chat AI 助手，也是基于 OpenAI 的技术构建的，自去年三月以来就能够在对话中生成图像。

DALL-E 的原始版本于 2021 年 1 月出现，OpenAI 在 2022 年 4 月推出了更强大的续作，以令人震惊的方式引发了 AI 生成图像的新时代，深深吸引了最初的封闭测试者。DALL-E 模型使用一种称为「潜在扩散」的技术，将噪音转化为它从训练数据集中获得的知识和提示的图像。同样的技术在去年 8 月也使开放权重模型 Stable Diffusion 诞生。

由于 DALL-E 是通过从人类创作的艺术作品的大规模数据集中获取概念来学习图像的，自从去年引入主流以来，AI 图像生成技术一直备受争议。这项技术引发了艺术家的抗议，他们担心它会取代他们或不道德地复制他们的风格，引发了关于未经版权持有人同意使用作为训练数据的被抓取图像的版权侵权的诉讼，以及关于美国版权办公室和美国地方法院对版权的新裁决。

作为对这些争议的回应，OpenAI 表示，DALL-E 3 将拒绝要求以在世艺术家风格制作图像的请求。OpenAI 还提供了一个表单，供创作者选择不让他们的图像用于训练未来的模型。这些措施似乎不太可能满足那些通常认为 AI 训练应该仅限于选择加入而不包含在默认图像数据集中的艺术家。

目前，美国的版权政策规定，纯粹由 AI 生成的艺术作品无法获得版权保护，因此使用 DALL-E 3 创建的任何图像都将属于公有领域。尽管 OpenAI 没有明确承认这一点，但它表示「您使用 DALL-E 3 创建的图像属于您，您无需我们的许可即可重新印刷、销售或制作商品。」这与去年 OpenAI 根据拥有所有生成物权的许可限制 DALL-E 2 图像使用的情况有了显著变化。

关于安全性，OpenAI 表示，与 DALL-E 2 一样，DALL-E 3 已经实施了关键字和图像检测过滤器，以限制其生成暴力、性或令人讨厌的内容。该系统还被编程拒绝生成涉及具名公众人物的请求，这一点在竞争的 AI 图像生成器 Midjourney 生成唐纳德·特朗普的虚假逮捕图像时曾引发问题。

OpenAI 表示，已经与被称为「红队成员」的专家合作，以识别和减轻潜在风险，如有害的偏见或制造宣传和虚假信息。OpenAI 没有提及其工具潜在用于以具有说服力的虚构来扭曲历史记录，尽管它表示正在尝试使用「来源分类器」工具，该工具可以帮助确定图像是否由 DALL-E 3 生成。

OpenAI 表示，这款 AI 图像生成器正在进行封闭测试。计划通过 API 在十月提供给 ChatGPT Plus 和企业客户，并在今年晚些时候在实验室中提供。

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
OpenAI图像生成器DALL-E2停止服务，DALL-E3接替其位置

OpenAI宣布关闭DALL-E2图像生成器服务，由其后续产品DALL-E3替代。DALL-E2在2022年4月面世后不久，以其能够根据简单文本提示生成高质量图像一举成名。但为了安全起见，大家可能需要下载自己特别喜欢的任何内容。

OpenAI DALL-E2 DALL-E3
荐今日AI：ChatGPT免注册可使用；开发者没法“白嫖”Gemini了；AI程序员首次入职科技公司；DALL·E聊天就能改图了

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

ChatGPT
OpenAI允许用户直接使用ChatGPT：无需注册账号

当地时间4月1日，知名人工智能公司OpenAI发布重要公告，宣布将允许用户无需注册即可直接使用ChatGPT，这一举措旨在让更多人能够轻松体验人工智能的魅力。值得注意的是，对于未注册的用户，某些高级功能如保存或分享聊天记录、使用个性化指令等将无法享受。这一举措既体现了OpenAI对于技术进步的追求，也充分尊重了用户的个人意愿和权益。

人工智能 OpenAI ChatGPT
微软发布iPhone可运行的ChatGPT级AI模型Phi-3系列挑战OpenAI地位

微软推出了一款名为Phi-3系列的小型AI模型，该模型在AI领域引起了广泛关注。Phi-3系列中的Phi-3-mini模型，仅拥有3.8B参数，却在多项基准测试中超越了拥有8B参数的Llama3模型。微软的这一举措在开源社区中引起了热烈讨论，许多网友认为这给OpenAI带来了压力，需要OpenAI尽快推出GPT-3.5的后继产品以维持其在AI领域的领先地位。

Phi-3 AI头条
重磅！OpenAI宣布无需注册即可使用ChatGPT

日前，OpenAI宣布放开限制，允许用户无需注册ChatGPT即可直接使用该服务，这将让人们更容易体验人工智能的潜力。OpenAI表示，将从周一开始逐步推出这一功能，让185个国家和地区的超1亿用户使用ChatGPT来学习新事物、寻找创意灵感，并获得问题答案。去年12月，中国工程院等单位发布2023全球十大工程成就，其中就包括ChatGPT，与中国空间站、百亿亿次超级计算机、鸿蒙操作系统等并列。

OpenAI ChatGPT 人工智能
OpenAI新GPT-4 Turbo模型上线：可供付费ChatGPT用户使用

OpenAI的全新GPT-4Turbo模型已全面上线，并正式向付费ChatGPT用户开放。GPT-4Turbo更新标志着人工智能领域的又一重要进步，为用户提供了更强大、更高效的文本处理、数学计算、逻辑推理以及编码能力。GPT-5预计将在今年夏季推出，有望在性能、功能和应用场景等方面实现更大的突破和创新。

OpenAI GPT-4 Turbo
荐OpenAI发布全新微调API ：ChatGPT支持更详细可视化微调啦！

4月5日凌晨，OpenAI在官网宣布新增6个全新微调API功能，以扩展自定义模型，帮助企业、开发人员更好地构建特定领域、精细化的ChatGPT应用。这些功能包括:基于Epoch的检查点创建、Playground新功能、第三方集成、全面验证指标、超参数配置和更详细的微调仪表板改进。如果对模型的请求超时或找不到模型名称，可能是因为模型仍在加载中，可在几分钟后重试。

OpenAI OpenAI
OpenAl可编辑版DALL·E来了靠聊天就能改图

OpenAl更新DALL•E编辑器界面的功能。用户可选择想要编辑的图像区域，并通过聊天来描述如何更改编辑图像。在对话面板中，您可以通过描述要对图像的突出显示区域进行的更改来完成编辑。

OpenAl DALL·E AI头条
ChatGPT使用量增长，OpenAI在东京开设首家亚洲办事处

人工智能聊天机器人ChatGPT的开发者表示，他们已经在东京开设了一家办事处，这是其在亚洲的第一家办事处，旨在响应该服务在日本日益增长的受欢迎程度。此举是在去年四月美国OpenAI的首席执行官SamAltman与日本首相岸田文雄在东京会晤后推出的，当时这位高管表示了在日本设立办事处的意向。OpenAI在东京开设首家亚洲办事处的举动，无疑将为日本的科技创新和经济发展注入新的活力，也为OpenAI在亚洲市场的拓展奠定了坚实基础。

ChatGPT OpenAI AI头条
荐ChatGPT现在能帮你P图了，只需简单说几个字

不论是网页、iOS还是安卓版的ChatGPT，都可以用上DALL-E3强大的编辑图像功能了。OpenAI的DALL-E今天进行了多项升级，在通往Midjourney加Photoshop的道路上又前进了一大步。」现在的ChatGPT，早已不是大语言模型这么简单。

AI ChatGPT DALL-E

今日大家都在搜的词：

热文

3 天
7天

OpenAI 发布 DALL-E 3 文生图模型：与 ChatGPT 完全集成 在细节和提示保真度方面挑战极限

今日大家都在搜的词：

热文

站长商机

OpenAI 发布 DALL-E 3 文生图模型：与 ChatGPT 完全集成在细节和提示保真度方面挑战极限