Stability AI发布图像生成模型新版本Stable Diffusion XL 1.0

2023-07-27 08:57 · 稿源：站长之家

站长之家(ChinaZ.com) 7月27日消息:今天，Stability AI宣布推出Stable Diffusion XL1.0，这是一款文本到图像的模型，该公司称之为迄今为止“最先进”的版本。除了Stability的API和消费者应用ClipDrop和DreamStudio之外，Stable Diffusion XL1.0还在GitHub上以开源的形式提供，Stability声称，与其前身相比，Stable Diffusion XL1.0提供了“更鲜艳”和“准确”的颜色，以及更好的对比度、阴影和光照效果。

AI绘画赛博朋克元宇宙女性酷 (1)

在接受TechCrunch采访时，Stability AI的应用机器学习负责人Joe Penna指出，Stable Diffusion XL1.0包含了35亿个参数，可以在多种纵横比下“在几秒钟内”产生全1兆像素分辨率的图像。“参数”是模型从训练数据中学习到的部分，基本上定义了模型在一个问题上的技能，在这里就是生成图像。

上一代Stable Diffusion模型，Stable Diffusion XL0.9，也可以产生更高分辨率的图像，但需要更多的计算力。

“Stable Diffusion XL1.0是可定制的，可以针对概念和风格进行微调。”Penna说。“它也更容易使用，能够通过基本的自然语言处理提示实现复杂的设计。”

Stable Diffusion XL1.0在文本生成方面也有所改进。虽然许多最好的文本到图像模型都难以生成带有清晰标志的图像，更不用说书法或字体了，但Penna说，Stable Diffusion XL1.0能够实现“先进”的文本生成和可读性。

此外，正如SiliconAngle和VentureBeat报道的那样，Stable Diffusion XL1.0还支持修复（重建图像缺失的部分）、扩展(扩展现有图像)和“图像到图像”提示——意味着用户可以输入一个图像，并添加一些文本提示来创建更详细的变化。而且，该模型能够理解复杂的、多部分的、用简短提示给出的指令，而之前的Stable Diffusion模型则需要更长的文本提示。

“我们希望通过发布这个更强大的开源模型，不仅图像的分辨率会增加四倍，而且还会带来一些巨大的进步，这将极大地惠及所有用户。”他补充说。

但是与之前版本的Stable Diffusion一样，该模型也引发了一些棘手的道德问题。

Stable Diffusion XL1.0的开源版本理论上可以被不法分子用来生成有毒或有害的内容，比如未经同意的换脸。这在一定程度上反映了用来训练它的数据:来自网络的数百万张图片。

无数教程演示了如何使用Stability AI自己的工具，包括DreamStudio，一个为Stable Diffusion提供开源前端界面的工具来创建换脸。还有无数其他教程展示了如何微调基础的Stable Diffusion模型来生成色情内容。

Penna并没有否认滥用是可能发生的——并承认该模型也包含了某些偏见。但他补充说，Stability AI已经采取了“额外的步骤”来减少有害内容的生成，通过过滤模型的训练数据中的“不安全”图像，发布与有问题的提示相关的新警告，并尽可能地在工具中屏蔽单个有问题的术语。

Stable Diffusion XL1.0的训练集还包括了一些艺术家的作品，这些艺术家曾经抗议过包括Stability AI在内的一些公司使用他们的作品作为生成式人工智能模型的训练数据。Stability AI声称，它受到了美国公平使用原则的法律保护。但这并没有阻止一些艺术家和库存照片公司Getty Images提起诉讼，以阻止这种做法。

Stability AI与初创公司Spawning有合作关系，尊重这些艺术家的“退出”请求，表示它并没有从其训练数据集中删除所有被标记的艺术作品，但它“继续考虑艺术家的要求”。

（举报）

相关推荐

关键词：

TabTab 登顶模力工场 AI 应用榜榜首，把 AI 数据分析师装进口袋，关键结论更快抵达！

TabTab是一款全链路AI数据分析助手，核心功能包括多源数据连接（支持文档、数据库、电商平台等）、自动化采集清洗、内置分析模型及可视化呈现。其优势在于通过多智能体系统实现自然语言交互，降低分析门槛，让非技术人员也能快速完成客户洞察、销售业绩等分析，显著提升效率。产品定位中立，致力于构建多元化AI效率提升生态。

数据驱动效率提升智能体
颠覆Diffusion局限！Utopai双模型耦合架构，攻克AI影视长叙事核心难题

Utopai Studios推出专为影视制作设计的AI模型与工作流，区别于主流视频生成模型，其核心能力在于理解剧本、规划镜头及生成场景，通过自回归模型负责叙事规划与一致性约束，扩散模型专注高质量画面渲染。该系统能解决跨镜头元素漂移难题，提升制作效率与作品品质。目前工作流仅用于公司自有项目，强调AI作为创作者协作者的角色，并遵循行业道德与版权规范。

AI影视制作 Utopai Studios
荐AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；Kimi K2成功接入Perplexity

本期AI日报聚焦多项技术突破：蚂蚁集团"灵光"AI助手实现30秒生成可编辑应用；xAI推出免费Grok 4.1模型显著提升质量与速度；Poe推出200人群聊功能支持多模型协作；OceanBase发布首款AI数据库seekdb实现混合搜索；国产模型Kimi K2接入Perplexity展现国际竞争力；谷歌DeepMind推出通用智能体SIMA2在3D游戏中任务完成率达62%；ElevenLabs升级为一站式内容生成平台；昆仑万维推出轻量级多模态智能体Skywork R1V4-Lite，用户拍照即可自动完成任务。

AI助手蚂蚁集团灵光App
苹果发布iOS 26.2 beta 2：动效更流畅、继续适配液态玻璃

苹果今天凌晨发布了iOS 26.2 beta 2，依然在适配更多的液态玻璃效果，并且还优化了动画效果，更流畅丝滑了。以下是本次主要更新内容：游戏库新增排序与筛选功能，支持手柄导航，且在播放过程中可实时更新分数。新版还强化了社交互动功能，用户可以直接从游戏”应用中邀请朋友进行挑战或实时多人游戏，当朋友打破你的高分纪录时，系统还会发送通知，方便你立即�

iOS 26.2 游戏库更新
火山引擎Data Agent赋能金融行业，打造智能投顾与精准营销新范式

在平安保险AIGC嘉年华上，火山引擎专家指出，企业正从“数据驱动”迈向“认知驱动”新时代，核心是构建沉淀集体智慧的“企业级认知引擎”。火山引擎推出数据智能体Data+Agent，定位新一代企业AI数字专家，具备主动思考、分析与行动能力，助力构建“数据大脑”。其聚焦智能分析Agent与智能营销Agent两大场景：前者实现“提问即生产”的数据消费新模式，提升金融业务分析效率90%；后者依托“一客一策”个性化服务，动态融合客户数据，突破传统标签限制。该产品已在多行业验证，营销点击率提升30%、投资回报率提高80%。未来将持续强化预测与模拟能力，深化金融、制造、医疗等领域的智能决策应用。

企业级认知引擎数据驱动认知驱动
星耀南山、创见未来，「X-Day」西丽湖路演社创业之星Next Star专场燃动科创热潮

11月15日，“X-Day”西丽湖路演社在深圳大学城举办“创业之星”Next+Star百万奖金全球赛专场，联动政府、投资、金融等多方资源，构建资本对接桥梁，助力创新项目落地南山。活动汇聚6个硬核项目，覆盖AI、生物医药等领域，展现前沿产业活力。平台通过常态化路演与赛事联动，已促成超5.3亿元股权融资及2.34亿元银行授信，持续优化区域科创生态，彰显南山“鼓励创新、支持创业”的浓厚氛围。

创业之星投贷保联动路演社
LIFETOO品牌缩醛磷脂荣获2025年TITAN健康奖，以科学创新推动脑健康产业升级

LIFETOO品牌凭借核心产品"缩醛磷脂脑活素"荣获2025年TITAN健康奖神经健康领域奖项。该成分通过高效抗氧化、调节神经功能及改善认知等机制发挥作用，动物实验显示能显著提升学习记忆能力。奖项认证了品牌在科研转化与成分应用方面的实力，为应对全球老龄化趋势下的脑健康挑战提供了科学解决方案，推动功能性食品行业向专业化发展。

TITAN健康奖缩醛磷脂脑活素神经健康
文远知行斩获美国以外首张城市级L4 Robotaxi商运牌照，中东规模化布局提速

11月10日，文远知行获阿联酋政府批准，取得全球首张城市级L4自动驾驶商业化运营牌照，可在阿布扎比开展无安全员的Robotaxi服务。这标志着其在中东实现纯无人运营落地。服务将通过Uber等平台上线，计划2026年车队扩至千台，2030年达数万台。凭借近百万公里数据与政府支持，公司将在阿布扎比实现单车盈亏平衡，并以此为起点推动全球智慧交通发展。

文远知行 Robotaxi L4自动驾驶
软件定义汽车的质量革命：AI Agent如何终结座舱OTA的“路测噩梦”

在“软件定义汽车”浪潮下，智能汽车竞争核心转向座舱体验、ADAS功能及OTA迭代质量。然而，传统软件测试模式成本高、耗时长，难以覆盖复杂场景，易导致漏洞。AI驱动的“无人测试”通过大模型与智能体技术实现三大突破：需求自主解析与测试规划、GUI自主探索与自愈维护、智能诊断与根因分析。这将催生“人机协同”新范式，测试工程师角色转向质量策略师。到2027年，超80%企业将集成AI测试工具，汽车行业2025年成为转型关键节点。

软件定义汽车智能汽车座舱体验
荐AI日报：百度发布文心5.0；可灵2.5Turbo模型上线“首尾帧”功能；微博推出 VibeThinker-1.5B

本期AI日报聚焦多项技术突破：OpenAI推出GPT-5.1，提升对话自然度与响应速度；百度发布原生全模态大模型文心5.0，支持跨文本图像生成；微博开源VibeThinker-1.5B模型，以低成本实现高效推理；可控视频生成模型新增首尾帧控制功能；李飞飞团队推出商用3D世界生成工具Marble；东北大学开源多语言翻译模型支持60种语言；谷歌Gemini语音功能升级实现更自然交互；阿里启动“千问”项目对标ChatGPT，全面布局C端AI应用竞争。

AI视频生成可灵2.5Turbo 首尾帧功能

今日大家都在搜的词：

热文

3 天
7天

Stability AI发布图像生成模型新版本Stable Diffusion XL 1.0

TabTab 登顶模力工场 AI 应用榜榜首，把 AI 数据分析师装进口袋，关键结论更快抵达！

颠覆Diffusion局限！Utopai双模型耦合架构，攻克AI影视长叙事核心难题

荐AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；Kimi K2成功接入Perplexity

苹果发布iOS 26.2 beta 2：动效更流畅、继续适配液态玻璃

火山引擎Data Agent赋能金融行业，打造智能投顾与精准营销新范式

星耀南山、创见未来，「X-Day」西丽湖路演社创业之星Next Star专场燃动科创热潮

LIFETOO品牌缩醛磷脂荣获2025年TITAN健康奖，以科学创新推动脑健康产业升级

文远知行斩获美国以外首张城市级L4 Robotaxi商运牌照，中东规模化布局提速

软件定义汽车的质量革命：AI Agent如何终结座舱OTA的“路测噩梦”

荐AI日报：百度发布文心5.0；可灵2.5Turbo模型上线“首尾帧”功能；微博推出 VibeThinker-1.5B

今日大家都在搜的词：

热文

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

华为Mate 80/Pro/Pro Max/RS开启预约：全系直屏设计

AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大

华为Mate X7外观公布搭载全新折叠玄武架构

阿里巴巴回应千问崩了：状态良好欢迎来问

荣耀500系列官宣将于11月24日发布

AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；

小米超级小爱AI大模型推出随心修图功能

一加Ace 6T官宣将于本月发布：首发骁龙8 Gen5

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT

华为Mate 80/Pro/Pro Max/RS开启预约：全系直屏设计

iPhone Pocket正式开售：联名三宅一生售价1299元起

1899元苹果手机包卖完了！iPhone Pocket在吐槽声中销售火爆

AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大

微信小程序将在iOS端支持接入虚拟支付苹果抽成15%

华为Mate X7外观公布搭载全新折叠玄武架构

华为WATCH ULTIMATE DESIGN非凡大师紫金款明天开启预售

站长商机