首页 > 业界 > 关键词  > StabilityAI最新资讯  > 正文

Stability AI 发布 35 亿个参数的图像生成模型 Stable Diffusion XL 1.0

2023-07-27 09:03 · 稿源:站长之家

站长之家(ChinaZ.com) 7月27日消息:人工智能初创公司 Stability AI 在面临日益激烈竞争和道德挑战的情况下,继续改进其生成式 AI 模型。

stability 平板电脑

SDXL 1.0 将在 Amazon Bedrock 上亮相,这是亚马逊 AWS) 提供的完全托管服务,可通过 API 访问领先的 AI 初创公司和 Amazon Titan 的基础模型。该公告是在年度 AWS 纽约峰会上发布的,进一步确认了 Amazon 致力于为客户提供最强大的文本到图像基础模型(例如 Stability AI 的 SDXL 1.0)的承诺。

今天,Stability AI 宣布推出名为 Stable Diffusion XL 1.0 的文本到图像模型,该公司称其为「迄今为止最先进」的版本。Stable Diffusion XL 1.0 可在 GitHub 上开源,并提供给 Stability 的 API 和消费者应用程序 ClipDrop 和 DreamStudio。Stability 声称,与其前身相比,Stable Diffusion XL 1.0 提供了「更鲜艳」和「更准确」的颜色,以及更好的对比度、阴影和光照。

Stability AI 的应用机器学习负责人 Joe Penna 在接受媒体采访时指出,Stable Diffusion XL 1.0 含有 35 亿个参数,可以在多种宽高比下「几秒钟内」生成完整的 100 万像素分辨率图像。在这种情况下,「参数」是模型从训练数据中学习到的部分,实际上定义了模型在解决问题时的技能,在本例中生成图像。

上一代的 Stable Diffusion 模型 Stable Diffusion XL 0.9 也可以生成更高分辨率的图像,但需要更多的计算能力。

Penna 表示:「Stable Diffusion XL 1.0 是可定制的,可以根据概念和风格进行微调。」他说:「它也更容易使用,可以通过基本的自然语言处理提示实现复杂的设计。」

此外,Stable Diffusion XL 1.0 在文本生成方面也有所改进。虽然许多最佳的文本到图像模型在生成图像上表现不佳,很难生成可辨认的标志、书法或字体,但 Stable Diffusion XL 1.0 可以进行「高级」文本生成和可读性,Penna 表示。

根据 SiliconAngle 和 VentureBeat 的报道,Stable Diffusion XL 1.0 还支持修复(重建图像中缺失的部分)、扩展(延长现有图像)和「图像到图像」的提示——这意味着用户可以输入图像并添加一些文本提示,以创建该图片的更详细变化。此外,该模型可以理解用短提示给出的复杂、多部分的指令,而以前的 Stable Diffusion 模型需要更长的文本提示。

Penna 承认滥用是可能的,他还承认模型也存在一定的偏见。但他补充说,Stability AI 采取了「额外措施」来减少有害内容的生成,通过对模型的训练数据进行「不安全」图像过滤,并发布与问题提示相关的新警告,尽可能地封锁工具中的有问题术语。

Stable Diffusion XL 1.0 的训练集还包括来自抗议企业(包括 Stability AI)使用他们的作品作为生成式 AI 模型训练数据的艺术家的艺术作品。Stability AI 声称,至少在美国,根据公平使用原则,它不承担法律责任。但这并没有阻止一些艺术家和股票照片公司 Getty Images 提起诉讼,以制止这种做法。

Stability AI 与初创公司 Spawning 合作,以尊重这些艺术家的「选择退出」请求。该公司表示,它并没有从训练数据集中删除所有被标记的艺术作品,但「继续纳入艺术家的请求」。

随着 Stability 在商业活动中遇到停滞,面临着 OpenAI、Midjourney 等竞争对手的激烈竞争,该公司正在推动合作伙伴关系和新能力的开发。今年 4 月,Semafor 报道称,Stability AI 迄今已筹集了超过 1 亿美元的风险投资,但该公司正在烧钱,促使其在 6 月关闭 2500 万美元的可转换票据,并寻求帮助增加销售。

Stability AI 首席执行官 Emad Mostaque 在新闻稿中表示:「最新的 SDXL 模型代表了 Stability AI 创新传统的下一步,以及能够为 AI 社区提供最前沿的开放访问模型的能力。」他还说:「在 Amazon Bedrock 上发布 1.0 版本表明我们与 AWS 紧密合作,为开发人员和客户提供最佳解决方案。

Stable Diffusion XL 1.0 GitHub:

https://github.com/Stability-AI/generative-models

举报

  • 相关推荐
  • 每日互动参与发起《人工智能安全行业自律倡议》 守护人工智能产业可持续发展

    9月17日,2025年国家网络安全宣传周人工智能安全治理分论坛在昆明召开,会上正式发布《人工智能安全行业自律倡议》。该倡议由中国网络空间安全协会联合多家科研院所、互联网头部企业、网络安全厂商及人工智能企业共同发起,提出筑牢安全根基、强化技管结合、深化协同共治等七方面共识,旨在推动构建可控、可信、可靠的人工智能产业生态,为全球人工智能治理贡献中国智慧。

  • 马斯克:Grok 5模型有望实现通用人工智能的突破

    马斯克旗下xAI公司正研发Grok 5模型,有望实现通用人工智能(AGI)重大突破。该模型采用全新架构设计,预计未来几周启动训练。若成功将代表AI从专用领域向通用认知能力的质的飞跃,被视为人工智能发展的终极目标。科技界密切关注xAI能否在激烈竞争的大模型赛道实现突破。

  • 十方融海:以开源生态为基,绘就“人工智能 +”产业融合新蓝图

    国务院印发《关于深入实施“人工智能+”行动的意见》,推动AI技术与产业深度融合。深圳企业十方融海凭借AI大模型研发、产品创新及开源生态构建等领域的卓越实践,成为行业先锋。其开源模型如OpenBuddy、小智AI等突破传统技术局限,实现多模态交互与跨领域知识融合,覆盖教育、办公、养老、文体等多元场景。通过开放共享模式,十方融海有效降低AI应用门槛,激发行业创新活力,助力我国人工智能产业迈向新征程。

  • iOS 26.1首个Beta版更新发布 苹果AI支持更多语言

    苹果发布iOS 26.1开发者预览版Beta更新,内部版本号23B5044l。主要更新包括:Apple Intelligence新增丹麦语、荷兰语、挪威语、葡萄牙语、瑞典语、土耳其语、繁体中文及越南语支持;AirPods实时翻译功能扩展至日语、韩语、意大利语和中文(含繁简);电话应用数字键盘采用全新液态玻璃设计。此外,Apple Music支持滑动切换歌曲,照片、日历和Safari浏览器迎来视觉优化。iOS 26正式版已于9月16日推送,适配第二代iPhone SE及之后共25款机型,iPhone 17系列和iPhone Air出厂预装该系统。

  • 祝贺!诺云荣登“人工智能+”新质生产力领航企业百强!

    2025年9月8日,国务院发布人工智能发展指导意见后,诺云凭借AI营销创新实践入选“人工智能+新质生产力百强榜单”,成为河南唯一入选企业。作为数字化营销技术服务商,诺云提供企业直播SaaS系统与私域运营工具,覆盖电商直播、企业培训等全场景需求。已服务超20万家企业,覆盖3亿用户,拓展至零售、教育等150多个行业,客户包括携程、华为等头部机构。诺云将持续深化AI技术应用,激发新质生产力潜能。

  • 王忠林赴格创东智调研人工智能产业高质量发展情况

    9月11日,湖北省领导王忠林一行调研格创东智人工智能产业发展。公司CEO何军汇报了自主研发的工业智能平台、能碳管理系统等应用成果。王忠林强调要深化人工智能在工业研发、生产等领域的应用,促进全要素智能联动,更好服务制造业向智能制造转型升级。

  • AI眼镜的痛,Meta也治不了

    对于全球科技从业者而言,Meta Connect大会是一年一度的重要时刻。 不少人早早守在电脑前,想知道扎克伯格此次会带来哪些前沿技术产品,更对会上即将亮相的新款AI眼镜充满关注。 事实上,AI眼镜这类消费电子产品,在过去一年里已快速从“小众科技产品”走进大众视野,但看似火热的市场背后,AI眼镜当下的发展却陷入了明显瓶颈。 此前,国内AI眼镜市场曾掀起“百镜大

  • 不止于价格,DigitalOcean、AWS和Linode该选谁?

    本文对比了DigitalOcean、AWS和Linode三大海外云服务商,从定位、成本、易用性、GPU性能及本土化支持等维度分析其优劣势。DigitalOcean以开发者友好、简单易用和高性价比著称,适合初创企业和中小团队;AWS功能全面但复杂昂贵,适合大型企业;Linode性能稳定但生态有限。特别强调DigitalOcean通过卓普云提供本土化支持,解决支付、备案和技术响应等痛点,是中国企业出海的高效选择。

  • 三星Galaxy Tab S10 Lite:为你开启多彩校园「星」生活!

    三星Galaxy Tab S10 Lite平板电脑是新学期学习的理想助手。它配备10.9英寸大屏,支持S Pen触控笔,提供流畅书写体验。多任务处理功能可同时运行多个应用,提高学习效率。轻巧便携设计适合校园使用,Vision Booster技术确保户外清晰显示。内置AI功能可快速搜索解题,是课堂笔记、资料查阅的得力工具。

  • 政策引领人工智能教育全面启动,猿力科技人工智能通识课覆盖千校

    国务院推动“人工智能+”行动,北京中小学新学期首次系统开设人工智能通识课程,每学年不少于8课时。猿力科技旗下飞象星球成为重要推动力量,其课程覆盖小学至初中全学段,包含10门课程、160节课,实践导向突出。该课程已服务北京298所学校、9.8万名学生,并推广至全国25个省市超1000所学校,覆盖15万学生,成为国内覆盖最广的人工智能通识课程之一。

今日大家都在搜的词: