Stability AI发布图像生成模型新版本Stable Diffusion XL 1.0

2023-07-27 08:57 · 稿源：站长之家

站长之家(ChinaZ.com) 7月27日消息:今天，Stability AI宣布推出Stable Diffusion XL1.0，这是一款文本到图像的模型，该公司称之为迄今为止“最先进”的版本。除了Stability的API和消费者应用ClipDrop和DreamStudio之外，Stable Diffusion XL1.0还在GitHub上以开源的形式提供，Stability声称，与其前身相比，Stable Diffusion XL1.0提供了“更鲜艳”和“准确”的颜色，以及更好的对比度、阴影和光照效果。

AI绘画赛博朋克元宇宙女性酷 (1)

在接受TechCrunch采访时，Stability AI的应用机器学习负责人Joe Penna指出，Stable Diffusion XL1.0包含了35亿个参数，可以在多种纵横比下“在几秒钟内”产生全1兆像素分辨率的图像。“参数”是模型从训练数据中学习到的部分，基本上定义了模型在一个问题上的技能，在这里就是生成图像。

上一代Stable Diffusion模型，Stable Diffusion XL0.9，也可以产生更高分辨率的图像，但需要更多的计算力。

“Stable Diffusion XL1.0是可定制的，可以针对概念和风格进行微调。”Penna说。“它也更容易使用，能够通过基本的自然语言处理提示实现复杂的设计。”

Stable Diffusion XL1.0在文本生成方面也有所改进。虽然许多最好的文本到图像模型都难以生成带有清晰标志的图像，更不用说书法或字体了，但Penna说，Stable Diffusion XL1.0能够实现“先进”的文本生成和可读性。

此外，正如SiliconAngle和VentureBeat报道的那样，Stable Diffusion XL1.0还支持修复（重建图像缺失的部分）、扩展(扩展现有图像)和“图像到图像”提示——意味着用户可以输入一个图像，并添加一些文本提示来创建更详细的变化。而且，该模型能够理解复杂的、多部分的、用简短提示给出的指令，而之前的Stable Diffusion模型则需要更长的文本提示。

“我们希望通过发布这个更强大的开源模型，不仅图像的分辨率会增加四倍，而且还会带来一些巨大的进步，这将极大地惠及所有用户。”他补充说。

但是与之前版本的Stable Diffusion一样，该模型也引发了一些棘手的道德问题。

Stable Diffusion XL1.0的开源版本理论上可以被不法分子用来生成有毒或有害的内容，比如未经同意的换脸。这在一定程度上反映了用来训练它的数据:来自网络的数百万张图片。

无数教程演示了如何使用Stability AI自己的工具，包括DreamStudio，一个为Stable Diffusion提供开源前端界面的工具来创建换脸。还有无数其他教程展示了如何微调基础的Stable Diffusion模型来生成色情内容。

Penna并没有否认滥用是可能发生的——并承认该模型也包含了某些偏见。但他补充说，Stability AI已经采取了“额外的步骤”来减少有害内容的生成，通过过滤模型的训练数据中的“不安全”图像，发布与有问题的提示相关的新警告，并尽可能地在工具中屏蔽单个有问题的术语。

Stable Diffusion XL1.0的训练集还包括了一些艺术家的作品，这些艺术家曾经抗议过包括Stability AI在内的一些公司使用他们的作品作为生成式人工智能模型的训练数据。Stability AI声称，它受到了美国公平使用原则的法律保护。但这并没有阻止一些艺术家和库存照片公司Getty Images提起诉讼，以阻止这种做法。

Stability AI与初创公司Spawning有合作关系，尊重这些艺术家的“退出”请求，表示它并没有从其训练数据集中删除所有被标记的艺术作品，但它“继续考虑艺术家的要求”。

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
Stability AI发布Stable LM2模型更新，参数增至120亿

站长之家（ChinaZ.com）4月9日消息:Stability AI在最新的Stable LM2模型更新中，宣布将参数增至120亿，以提升性能与可访问性。该更新为用户提供了更强大、更精确的文本内容生成能力。Stability AI指出，该模型在特定基准测试下表现优异，超过了Llama270B等更大型模型。新的Stable LM212B模型包括基础版本和经过指导调整的变体，旨在增强七种语言（英语、西班牙语、德语、意大利语、法�

StabilityAI StableLM2 AI头条
Stability AI发布音频模型 Stable Audio2.0:支持生成多种类型音乐时长达3分钟

著名开源大模型平台Stability.ai在官网正式发布了音频模型StableAudio2.0。这一版本支持用户通过文本或音频生成多种类型的高质量音乐，时长可达3分钟44.1kHz。随着Stability.ai不断推出新功能和技术，用户可以期待更多高质量、多样化的音乐生成体验。

StableAudio StableAudio2.0 AI头条
Stability AI发布CosXL模型图像处理能力更精细

StabilityAI最近推出了CosXL模型，这是一项包括基础版CoXL和增强版EditCosXL的创新技术。这些模型的发布，标志着图像生成和编辑技术的新里程碑，为用户提供了更加强大和精细的图像处理能力。特别是ComfyUI，它还为用户提供了详细的工作流程和指导，帮助用户更加高效和便捷地使用CosXL模型。

CosXL AI头条
突发！Stable Diffusion 3，可通过API使用啦

4月18日，著名开源大模型平台Stability.ai在官网宣布，最新文生图模型StableDiffusion3和SD3Turbo可以在API中使用。本次继续由知名API管理平台FireworksAI提供服务。在山顶上有一位巫师创作了一幅令人惊叹的艺术作品，他用魔法创造了文字"StableDiffusion3API"。

StableDiffusion3 API AI头条
Midjourney指控Stability AI员工入侵其数据库并窃取图像

据AI爱好者NickSt.Pierre最近在X上分享的消息，周六发生了一起被指称为侵犯知识产权的事件。StabilityAI的员工入侵了Midjourney的数据库，窃取了所有的提示和图像对，这一行为还导致了长达24小时的服务中断。在这场AI公司之间的冲突中，让我们拭目以待进展，看看这一事件是否会对这两家公司之间的关系产生持久影响。

Midjourney StabilityAI AI头条
Stable Diffusion 3 API申请入口 AI文生图API官方免费申请地址

StableDiffusion3API是一款先进的文本到图像生成系统，它在排版和提示遵循方面与DALL-E3和Midjourneyv6等顶尖系统相匹敌或更优。该系统采用新的多模态扩散变换器架构，使用不同的权重集来改善图像和语言的表示，从提高文本理解和拼写能力。StableDiffusion3API的使用场景示例在以下情况下，您可以使用StableDiffusion3API进行图像生成：生成广告宣传图创建游戏角色概念图辅助教学材料的图像制作产品特色和功能StableDiffusion3API具有以下特色和功能：文本到图像的生成多模态扩散变换器架构图像和语言的独立表示文本理解和拼写能力提升想要了解更多关于StableDiffusion3API的信息并开始您的图像生成之旅，请访问StableDiffusion3API官方网站。

StableDiffusion3API
荐模型未发API先至！Stable Diffusion 3 API 发布性能比肩 Midjourney v6

其开发者平台API现已支持最新版本的StableDiffusion3及其增强版本StableDiffusion3Turbo。这一发布标志着StabilityAI在文字到图像生成领域的技术进步，其性能已经达到甚至超越了行业内的一些领先模型，如DALL-E3和Midjourneyv6。公司承诺提供99.9%的服务可用性，这对于企业用户来说尤为重要，因为他们在使用开发者平台进行关键的生成型AI工作时，需要确保服务的稳定性和可靠性。

StableDiffusion3
据称Stability AI资金告急，无法支付租用的云GPU账单

生成式AI明星StabilityAI的热门文本到图像生成模型StableDiffusion所需的大规模GPU集群似乎也部分导致了前首席执行官EmadMostaque的失败-因为他找不到支付这些GPU的方法。根据引用公司文件和数十位知情人士的详尽报道，据称这家英国模型构建公司的极高基础设施成本耗尽了公司的现金储备，导致截至去年十月时，公司只剩下400万美元。计划将其在CoreWeave的GPU容量转售给风险投资公司

StabilityAI AI头条
Stability AI宣布裁员20人，约占员工总数的10%

英国AI公司StabilityAI宣布裁员20人，占其员工总数的约10%。该公司刚刚宣布扩大其旗舰模型的使用范围。这起案件将很快在英国进行审理。

StabilityAI AI头条
Meta 在 WhatsApp 中加入实时AI图像生成功能

当用户在与MetaAI的聊天中开始输入文本到图像的提示时，将看到随着添加更多关于想创建的内容的细节，图像如何变化。在Meta分享的示例中，一个用户输入了提示:“想象一场在火星上进行的足球比赛。这一新功能是Meta在其所有应用程序中推出AI功能的一部分，包括WhatsApp、Instagram、Facebook和Messenger。

WhatsApp Meta AI图像生成

今日大家都在搜的词：

热文

3 天
7天

Stability AI发布图像生成模型新版本Stable Diffusion XL 1.0

今日大家都在搜的词：

热文

站长商机