首页 > 业界 > 关键词  > StabilityAI最新资讯  > 正文

Stability AI发布图像生成模型新版本Stable Diffusion XL 1.0

2023-07-27 08:57 · 稿源:站长之家

站长之家(ChinaZ.com) 7月27日 消息:今天,Stability AI宣布推出Stable Diffusion XL1.0,这是一款文本到图像的模型,该公司称之为迄今为止“最先进”的版本。除了Stability的API和消费者应用ClipDrop和DreamStudio之外,Stable Diffusion XL1.0还在GitHub上以开源的形式提供,Stability声称,与其前身相比,Stable Diffusion XL1.0提供了“更鲜艳”和“准确”的颜色,以及更好的对比度、阴影和光照效果。

AI绘画 赛博朋克 元宇宙 女性 酷 (1)

在接受TechCrunch采访时,Stability AI的应用机器学习负责人Joe Penna指出,Stable Diffusion XL1.0包含了35亿个参数,可以在多种纵横比下“在几秒钟内”产生全1兆像素分辨率的图像。“参数”是模型从训练数据中学习到的部分,基本上定义了模型在一个问题上的技能,在这里就是生成图像。

上一代Stable Diffusion模型,Stable Diffusion XL0.9,也可以产生更高分辨率的图像,但需要更多的计算力。

“Stable Diffusion XL1.0是可定制的,可以针对概念和风格进行微调。”Penna说。“它也更容易使用,能够通过基本的自然语言处理提示实现复杂的设计。”

Stable Diffusion XL1.0在文本生成方面也有所改进。虽然许多最好的文本到图像模型都难以生成带有清晰标志的图像,更不用说书法或字体了,但Penna说,Stable Diffusion XL1.0能够实现“先进”的文本生成和可读性。

此外,正如SiliconAngle和VentureBeat报道的那样,Stable Diffusion XL1.0还支持修复(重建图像缺失的部分)、扩展(扩展现有图像)和“图像到图像”提示——意味着用户可以输入一个图像,并添加一些文本提示来创建更详细的变化。而且,该模型能够理解复杂的、多部分的、用简短提示给出的指令,而之前的Stable Diffusion模型则需要更长的文本提示。

“我们希望通过发布这个更强大的开源模型,不仅图像的分辨率会增加四倍,而且还会带来一些巨大的进步,这将极大地惠及所有用户。”他补充说。

但是与之前版本的Stable Diffusion一样,该模型也引发了一些棘手的道德问题。

Stable Diffusion XL1.0的开源版本理论上可以被不法分子用来生成有毒或有害的内容,比如未经同意的换脸。这在一定程度上反映了用来训练它的数据:来自网络的数百万张图片。

无数教程演示了如何使用Stability AI自己的工具,包括DreamStudio,一个为Stable Diffusion提供开源前端界面的工具来创建换脸。还有无数其他教程展示了如何微调基础的Stable Diffusion模型来生成色情内容。

Penna并没有否认滥用是可能发生的——并承认该模型也包含了某些偏见。但他补充说,Stability AI已经采取了“额外的步骤”来减少有害内容的生成,通过过滤模型的训练数据中的“不安全”图像,发布与有问题的提示相关的新警告,并尽可能地在工具中屏蔽单个有问题的术语。

Stable Diffusion XL1.0的训练集还包括了一些艺术家的作品,这些艺术家曾经抗议过包括Stability AI在内的一些公司使用他们的作品作为生成式人工智能模型的训练数据。Stability AI声称,它受到了美国公平使用原则的法律保护。但这并没有阻止一些艺术家和库存照片公司Getty Images提起诉讼,以阻止这种做法。

Stability AI与初创公司Spawning有合作关系,尊重这些艺术家的“退出”请求,表示它并没有从其训练数据集中删除所有被标记的艺术作品,但它“继续考虑艺术家的要求”。

举报

  • 相关推荐
  • 数贸会今日开幕!每日互动展台人气火爆,GAI Station引领AI办公新体验

    2025全球数字贸易博览会于9月25日在杭州开幕。每日互动公司(展位7A-T022)集中展示了AI产业实践与数据流通领域成果,重点推出10万元级智能工作站GAI+Station,集成写作、会议纪要、智能问答等功能,内置8大模型能力,破解成本与安全痛点。其“发数站”战略打通数据高效流通链路,已在医疗、交通等多领域落地,“数智绿波”应用覆盖全国30多个省市,通行效率提升20%以上。此外,AITA超级营销助手实现升级,机器狗互动表演吸引关注。展会期间将举办10余场专业发布,涵盖数据要素、大模型应用等行业实战,助力企业把握数字化机遇。

  • Reviews.ai 依托 DigitalOcean 高效实现 AI 业务扩展

    Reviews.ai是一个消费者反馈聚合平台,帮助品牌将客户评论转化为可执行的洞察。该平台专注于评论分析,通过AI驱动功能(如按需报告、主题分类和智能代理)提升产品与服务。近期从Review Monitor更名后,团队迁移至DigitalOcean云平台,解决了原有专用服务器架构的扩展瓶颈。迁移过程在合作伙伴Aquazeel支持下高效完成,仅用数周,成本降低近30%。新架构采用Droplets、托管数据库和负载均衡器,支持灵活扩展。未来计划利用GPU Droplets增强AI能力,进一步优化大型语言模型处理效率。

  • 腾讯云大数据TBDS重磅升级,助力金融行业构建Data+AI一体化数智新范式

    腾讯云在腾讯全球数字生态大会上宣布,其大数据平台TBDS面向AI时代完成重磅升级。此次升级聚焦“数据与AI一体化”,旨在为金融机构提供兼具数据工程与数据科学能力的综合平台,打破传统数据处理与智能应用间的壁垒。新TBDS通过多模湖仓平台、WeData数智开发治理平台及DataAgent数据智能即服务构成核心架构,实现数据存储、管理、开发、治理与运维全面智能化。平台支持多模数据统一汇聚、异构计算负载调度,并显著提升数据开发到模型上线的全链路效率。在金融场景中,新TBDS已应用于信贷自动审批等业务,帮助机构提质增效。未来,腾讯云TBDS将持续发挥专业化与智能化优势,助力金融行业加速数字化转型。

  • iOS 26.1首个Beta版更新发布 苹果AI支持更多语言

    苹果发布iOS 26.1开发者预览版Beta更新,内部版本号23B5044l。主要更新包括:Apple Intelligence新增丹麦语、荷兰语、挪威语、葡萄牙语、瑞典语、土耳其语、繁体中文及越南语支持;AirPods实时翻译功能扩展至日语、韩语、意大利语和中文(含繁简);电话应用数字键盘采用全新液态玻璃设计。此外,Apple Music支持滑动切换歌曲,照片、日历和Safari浏览器迎来视觉优化。iOS 26正式版已于9月16日推送,适配第二代iPhone SE及之后共25款机型,iPhone 17系列和iPhone Air出厂预装该系统。

  • 华为AI城市峰会:共建城市数智底座,AI CITY先锋城市案例发布

    9月18日,华为全联接大会2025期间举办AI城市峰会,聚焦智慧城市治理、政务服务与产业升级。华为发布“AI CITY 1234MNX”参考架构,通过智能云底座、安全保障体系及统一平台,推动城市全域智能化转型。会议分享了深圳、广州等地的实践案例,展示AI在政务、城市管理及工业领域的应用成效,并呼吁各方共建AI城市生态,加速数字化进程。

  • AI日报:腾讯重磅发布混元图像3.0;快手发布KAT系列Agentic Coding大模型;苹果悄然研发ChatGPT式应用

    快手发布KAT系列代码大模型,腾讯推出“混元图像3.0”实现多模态突破,苹果研发类ChatGPT应用升级Siri,谷歌更新Gemini 2.5 Flash Lite提升效率。苹果还推出Manzano图像模型,YouTube Music测试AI音乐主播功能,VideoFrom3D框架简化3D视频生成,Moondream 3.0在多项基准测试中超越GPT-5等顶尖模型,展现强大性能。

  • 小米开启澎湃OS 3 Beta版最新招募:支持小米14、K70等机型

    小米澎湃OS 3 Beta版于9月24日启动招募,覆盖MIX Fold 4、MIX Flip、小米14 Ultra、14 Pro及钛金属版(卫星通讯)、小米14、Redmi K70系列四款机型和小米平板6S Pro 12.4共12款设备。招募采用分批推送机制,每机型设两批次,首批满员后启动第二批,入选用户优先获得更新。正式版将于10月15日推送,逐步扩大覆盖。该系统基于自研底层内核,通过深度优化微架构流水线,精准识别CPU空转,配合一体化调频技术,整体任务执行效率提升19%,带来更流畅体验。此次招募既为用户提供抢先体验机会,也通过反馈助力系统优化,强化小米生态竞争力。

  • 不止于价格,DigitalOcean、AWS和Linode该选谁?

    本文对比了DigitalOcean、AWS和Linode三大海外云服务商,从定位、成本、易用性、GPU性能及本土化支持等维度分析其优劣势。DigitalOcean以开发者友好、简单易用和高性价比著称,适合初创企业和中小团队;AWS功能全面但复杂昂贵,适合大型企业;Linode性能稳定但生态有限。特别强调DigitalOcean通过卓普云提供本土化支持,解决支付、备案和技术响应等痛点,是中国企业出海的高效选择。

  • 三星Galaxy Tab S10 Lite:为你开启多彩校园「星」生活!

    三星Galaxy Tab S10 Lite平板电脑是新学期学习的理想助手。它配备10.9英寸大屏,支持S Pen触控笔,提供流畅书写体验。多任务处理功能可同时运行多个应用,提高学习效率。轻巧便携设计适合校园使用,Vision Booster技术确保户外清晰显示。内置AI功能可快速搜索解题,是课堂笔记、资料查阅的得力工具。

  • 小米澎湃OS 3 Beta版第三批机型开启推送:覆盖小米14系列、K70系列等十款

    小米澎湃OS+3 Beta版第三批推送已启动,覆盖10款设备,包括小米MIX Fold 4、14 Ultra等。该系统采用自研底层技术,通过一体化调频提升效率,任务执行效率提升19%,流畅度、稳定性和动画过渡均有优化。新增“小米超级岛”功能,支持三岛并存,可显示快递、天气等实用信息。超级小爱助手全面升级,提供智能操作建议,简化用户步骤。正式版将于10月15日首批推送,后续覆盖更多机型。

今日大家都在搜的词: