Stability AI 发布 35 亿个参数的图像生成模型 Stable Diffusion XL 1.0

2023-07-27 09:03 · 稿源：站长之家

站长之家(ChinaZ.com) 7月27日消息:人工智能初创公司 Stability AI 在面临日益激烈竞争和道德挑战的情况下，继续改进其生成式 AI 模型。

stability 平板电脑

SDXL 1.0 将在 Amazon Bedrock 上亮相，这是亚马逊 AWS) 提供的完全托管服务，可通过 API 访问领先的 AI 初创公司和 Amazon Titan 的基础模型。该公告是在年度 AWS 纽约峰会上发布的，进一步确认了 Amazon 致力于为客户提供最强大的文本到图像基础模型（例如 Stability AI 的 SDXL 1.0）的承诺。

今天，Stability AI 宣布推出名为 Stable Diffusion XL 1.0 的文本到图像模型，该公司称其为「迄今为止最先进」的版本。Stable Diffusion XL 1.0 可在 GitHub 上开源，并提供给 Stability 的 API 和消费者应用程序 ClipDrop 和 DreamStudio。Stability 声称，与其前身相比，Stable Diffusion XL 1.0 提供了「更鲜艳」和「更准确」的颜色，以及更好的对比度、阴影和光照。

Stability AI 的应用机器学习负责人 Joe Penna 在接受媒体采访时指出，Stable Diffusion XL 1.0 含有 35 亿个参数，可以在多种宽高比下「几秒钟内」生成完整的 100 万像素分辨率图像。在这种情况下，「参数」是模型从训练数据中学习到的部分，实际上定义了模型在解决问题时的技能，在本例中生成图像。

上一代的 Stable Diffusion 模型 Stable Diffusion XL 0.9 也可以生成更高分辨率的图像，但需要更多的计算能力。

Penna 表示：「Stable Diffusion XL 1.0 是可定制的，可以根据概念和风格进行微调。」他说：「它也更容易使用，可以通过基本的自然语言处理提示实现复杂的设计。」

此外，Stable Diffusion XL 1.0 在文本生成方面也有所改进。虽然许多最佳的文本到图像模型在生成图像上表现不佳，很难生成可辨认的标志、书法或字体，但 Stable Diffusion XL 1.0 可以进行「高级」文本生成和可读性，Penna 表示。

根据 SiliconAngle 和 VentureBeat 的报道，Stable Diffusion XL 1.0 还支持修复（重建图像中缺失的部分）、扩展（延长现有图像）和「图像到图像」的提示——这意味着用户可以输入图像并添加一些文本提示，以创建该图片的更详细变化。此外，该模型可以理解用短提示给出的复杂、多部分的指令，而以前的 Stable Diffusion 模型需要更长的文本提示。

Penna 承认滥用是可能的，他还承认模型也存在一定的偏见。但他补充说，Stability AI 采取了「额外措施」来减少有害内容的生成，通过对模型的训练数据进行「不安全」图像过滤，并发布与问题提示相关的新警告，尽可能地封锁工具中的有问题术语。

Stable Diffusion XL 1.0 的训练集还包括来自抗议企业（包括 Stability AI）使用他们的作品作为生成式 AI 模型训练数据的艺术家的艺术作品。Stability AI 声称，至少在美国，根据公平使用原则，它不承担法律责任。但这并没有阻止一些艺术家和股票照片公司 Getty Images 提起诉讼，以制止这种做法。

Stability AI 与初创公司 Spawning 合作，以尊重这些艺术家的「选择退出」请求。该公司表示，它并没有从训练数据集中删除所有被标记的艺术作品，但「继续纳入艺术家的请求」。

随着 Stability 在商业活动中遇到停滞，面临着 OpenAI、Midjourney 等竞争对手的激烈竞争，该公司正在推动合作伙伴关系和新能力的开发。今年 4 月，Semafor 报道称，Stability AI 迄今已筹集了超过 1 亿美元的风险投资，但该公司正在烧钱，促使其在 6 月关闭 2500 万美元的可转换票据，并寻求帮助增加销售。

Stability AI 首席执行官 Emad Mostaque 在新闻稿中表示：「最新的 SDXL 模型代表了 Stability AI 创新传统的下一步，以及能够为 AI 社区提供最前沿的开放访问模型的能力。」他还说：「在 Amazon Bedrock 上发布 1.0 版本表明我们与 AWS 紧密合作，为开发人员和客户提供最佳解决方案。」

Stable Diffusion XL 1.0 GitHub：

https://github.com/Stability-AI/generative-models

（举报）

相关推荐

关键词：

跨境支付的未来：人工智能、嵌入式金融和即时结算

本文系统分析了人工智能、嵌入式金融与即时结算三大技术趋势如何重构跨境支付体系。人工智能通过智能填单、动态风控和预测性维护显著提升支付效率与安全性；嵌入式金融将支付功能无缝融入电商平台与供应链，实现“无跳转支付”；即时结算技术将跨境支付时间从数日缩短至秒级，并优化现金流。三大技术深度融合形成协同效应，推动跨境支付向更智能、高效、无缝�

全球支付生态数字化浪潮跨境支付体系
人工智能落地“最后一公里”，戴尔工作站助力AI应用提速

AI应用落地面临“最后一公里”部署难题：传统流程繁琐耗时，从模型开发到上线需数周。英特尔携手戴尔与零克云打造“工作站-AI PC-云端”协同生态，通过本地工作站进行小规模测试验证，降低试错成本与数据泄露风险，再通过“一键部署”快速扩展至云端规模化落地。这种“先本地验证、后云端放大”的路径显著提升开发效率，释放团队创造力，让有价值的AI想法快速照进现实。

AI部署模型上线服务器配置
TabTab 登顶模力工场 AI 应用榜榜首，把 AI 数据分析师装进口袋，关键结论更快抵达！

TabTab是一款全链路AI数据分析助手，核心功能包括多源数据连接（支持文档、数据库、电商平台等）、自动化采集清洗、内置分析模型及可视化呈现。其优势在于通过多智能体系统实现自然语言交互，降低分析门槛，让非技术人员也能快速完成客户洞察、销售业绩等分析，显著提升效率。产品定位中立，致力于构建多元化AI效率提升生态。

数据驱动效率提升智能体
简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

广州简知科技自主研发的“简智AI大模型”通过国家生成式人工智能服务备案，标志着该模型在安全性、合规性与可靠性方面达到国家级标准。作为兴趣教育领域AI应用的重要里程碑，该模型围绕用户兴趣成长周期设计，提供个性化学习支持：可为未明确兴趣方向的用户智能推荐内容，为入门用户规划学习路径，为基础扎实用户提供进阶训练与智能反馈。其技术能力在旗下“简小知”等品牌中已实现“学—练—评—测”全流程覆盖，并通过社群互动增强学习动力。公司未来将持续优化模型能力，联合行业伙伴构建完整培养体系，推动兴趣教育向个性化、高质量方向发展。

简智AI大模型生成式人工智能兴趣教育
颠覆Diffusion局限！Utopai双模型耦合架构，攻克AI影视长叙事核心难题

Utopai Studios推出专为影视制作设计的AI模型与工作流，区别于主流视频生成模型，其核心能力在于理解剧本、规划镜头及生成场景，通过自回归模型负责叙事规划与一致性约束，扩散模型专注高质量画面渲染。该系统能解决跨镜头元素漂移难题，提升制作效率与作品品质。目前工作流仅用于公司自有项目，强调AI作为创作者协作者的角色，并遵循行业道德与版权规范。

AI影视制作 Utopai Studios
荐AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；Kimi K2成功接入Perplexity

本期AI日报聚焦多项技术突破：蚂蚁集团"灵光"AI助手实现30秒生成可编辑应用；xAI推出免费Grok 4.1模型显著提升质量与速度；Poe推出200人群聊功能支持多模型协作；OceanBase发布首款AI数据库seekdb实现混合搜索；国产模型Kimi K2接入Perplexity展现国际竞争力；谷歌DeepMind推出通用智能体SIMA2在3D游戏中任务完成率达62%；ElevenLabs升级为一站式内容生成平台；昆仑万维推出轻量级多模态智能体Skywork R1V4-Lite，用户拍照即可自动完成任务。

AI助手蚂蚁集团灵光App
共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

10月28日，AtomGit平台在北京国家会议中心举行升级发布会，正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞，强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源，打造开放中立的基础设施，计划于11月21日正式上线。华为、百度等企业代表分享了开源实践，多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

开源社区人工智能 AtomGit
人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

科杰科技董事善于洋在2025中国国际数字经济博览会发表演讲，强调高质量数据集是人工智能产业决胜关键。他指出，算力、算法和数据构成AI三大要素，而数据决定模型认知边界与输出可靠性。当前需构建Data&AI一体化平台作为核心基础设施，通过集中管理、分散赋能模式，打通数据采集、治理到AI训练全链路，推动产业智能化升级。该平台已在制造、金融等领域落地，助力企业释放数据要素价值，实现弯道超车。

人工智能数据基础设施数字经济
苹果发布iOS 26.2 beta 2：动效更流畅、继续适配液态玻璃

苹果今天凌晨发布了iOS 26.2 beta 2，依然在适配更多的液态玻璃效果，并且还优化了动画效果，更流畅丝滑了。以下是本次主要更新内容：游戏库新增排序与筛选功能，支持手柄导航，且在播放过程中可实时更新分数。新版还强化了社交互动功能，用户可以直接从游戏”应用中邀请朋友进行挑战或实时多人游戏，当朋友打破你的高分纪录时，系统还会发送通知，方便你立即�

iOS 26.2 游戏库更新
星耀南山、创见未来，「X-Day」西丽湖路演社创业之星Next Star专场燃动科创热潮

11月15日，“X-Day”西丽湖路演社在深圳大学城举办“创业之星”Next+Star百万奖金全球赛专场，联动政府、投资、金融等多方资源，构建资本对接桥梁，助力创新项目落地南山。活动汇聚6个硬核项目，覆盖AI、生物医药等领域，展现前沿产业活力。平台通过常态化路演与赛事联动，已促成超5.3亿元股权融资及2.34亿元银行授信，持续优化区域科创生态，彰显南山“鼓励创新、支持创业”的浓厚氛围。

创业之星投贷保联动路演社

今日大家都在搜的词：

热文

3 天
7天

Stability AI 发布 35 亿个参数的图像生成模型 Stable Diffusion XL 1.0

跨境支付的未来：人工智能、嵌入式金融和即时结算

人工智能落地“最后一公里”，戴尔工作站助力AI应用提速

TabTab 登顶模力工场 AI 应用榜榜首，把 AI 数据分析师装进口袋，关键结论更快抵达！

简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

颠覆Diffusion局限！Utopai双模型耦合架构，攻克AI影视长叙事核心难题

荐AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；Kimi K2成功接入Perplexity

共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

苹果发布iOS 26.2 beta 2：动效更流畅、继续适配液态玻璃

星耀南山、创见未来，「X-Day」西丽湖路演社创业之星Next Star专场燃动科创热潮

今日大家都在搜的词：

热文

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

华为Mate 80/Pro/Pro Max/RS开启预约：全系直屏设计

AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大

华为Mate X7外观公布搭载全新折叠玄武架构

阿里巴巴回应千问崩了：状态良好欢迎来问

荣耀500系列官宣将于11月24日发布

一加Ace 6T官宣将于本月发布：首发骁龙8 Gen5

小米超级小爱AI大模型推出随心修图功能

参与开发iPhoneAir设计师离职转投AI初创公司

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT

华为Mate 80/Pro/Pro Max/RS开启预约：全系直屏设计

iPhone Pocket正式开售：联名三宅一生售价1299元起

1899元苹果手机包卖完了！iPhone Pocket在吐槽声中销售火爆

AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大

微信小程序将在iOS端支持接入虚拟支付苹果抽成15%

华为WATCH ULTIMATE DESIGN非凡大师紫金款明天开启预售

华为Mate X7外观公布搭载全新折叠玄武架构

站长商机