首页 > 业界 > 关键词  > StabilityAI最新资讯  > 正文

Stability AI 发布 35 亿个参数的图像生成模型 Stable Diffusion XL 1.0

2023-07-27 09:03 · 稿源:站长之家

站长之家(ChinaZ.com) 7月27日消息:人工智能初创公司 Stability AI 在面临日益激烈竞争和道德挑战的情况下,继续改进其生成式 AI 模型。

stability 平板电脑

SDXL 1.0 将在 Amazon Bedrock 上亮相,这是亚马逊 AWS) 提供的完全托管服务,可通过 API 访问领先的 AI 初创公司和 Amazon Titan 的基础模型。该公告是在年度 AWS 纽约峰会上发布的,进一步确认了 Amazon 致力于为客户提供最强大的文本到图像基础模型(例如 Stability AI 的 SDXL 1.0)的承诺。

今天,Stability AI 宣布推出名为 Stable Diffusion XL 1.0 的文本到图像模型,该公司称其为「迄今为止最先进」的版本。Stable Diffusion XL 1.0 可在 GitHub 上开源,并提供给 Stability 的 API 和消费者应用程序 ClipDrop 和 DreamStudio。Stability 声称,与其前身相比,Stable Diffusion XL 1.0 提供了「更鲜艳」和「更准确」的颜色,以及更好的对比度、阴影和光照。

Stability AI 的应用机器学习负责人 Joe Penna 在接受媒体采访时指出,Stable Diffusion XL 1.0 含有 35 亿个参数,可以在多种宽高比下「几秒钟内」生成完整的 100 万像素分辨率图像。在这种情况下,「参数」是模型从训练数据中学习到的部分,实际上定义了模型在解决问题时的技能,在本例中生成图像。

上一代的 Stable Diffusion 模型 Stable Diffusion XL 0.9 也可以生成更高分辨率的图像,但需要更多的计算能力。

Penna 表示:「Stable Diffusion XL 1.0 是可定制的,可以根据概念和风格进行微调。」他说:「它也更容易使用,可以通过基本的自然语言处理提示实现复杂的设计。」

此外,Stable Diffusion XL 1.0 在文本生成方面也有所改进。虽然许多最佳的文本到图像模型在生成图像上表现不佳,很难生成可辨认的标志、书法或字体,但 Stable Diffusion XL 1.0 可以进行「高级」文本生成和可读性,Penna 表示。

根据 SiliconAngle 和 VentureBeat 的报道,Stable Diffusion XL 1.0 还支持修复(重建图像中缺失的部分)、扩展(延长现有图像)和「图像到图像」的提示——这意味着用户可以输入图像并添加一些文本提示,以创建该图片的更详细变化。此外,该模型可以理解用短提示给出的复杂、多部分的指令,而以前的 Stable Diffusion 模型需要更长的文本提示。

Penna 承认滥用是可能的,他还承认模型也存在一定的偏见。但他补充说,Stability AI 采取了「额外措施」来减少有害内容的生成,通过对模型的训练数据进行「不安全」图像过滤,并发布与问题提示相关的新警告,尽可能地封锁工具中的有问题术语。

Stable Diffusion XL 1.0 的训练集还包括来自抗议企业(包括 Stability AI)使用他们的作品作为生成式 AI 模型训练数据的艺术家的艺术作品。Stability AI 声称,至少在美国,根据公平使用原则,它不承担法律责任。但这并没有阻止一些艺术家和股票照片公司 Getty Images 提起诉讼,以制止这种做法。

Stability AI 与初创公司 Spawning 合作,以尊重这些艺术家的「选择退出」请求。该公司表示,它并没有从训练数据集中删除所有被标记的艺术作品,但「继续纳入艺术家的请求」。

随着 Stability 在商业活动中遇到停滞,面临着 OpenAI、Midjourney 等竞争对手的激烈竞争,该公司正在推动合作伙伴关系和新能力的开发。今年 4 月,Semafor 报道称,Stability AI 迄今已筹集了超过 1 亿美元的风险投资,但该公司正在烧钱,促使其在 6 月关闭 2500 万美元的可转换票据,并寻求帮助增加销售。

Stability AI 首席执行官 Emad Mostaque 在新闻稿中表示:「最新的 SDXL 模型代表了 Stability AI 创新传统的下一步,以及能够为 AI 社区提供最前沿的开放访问模型的能力。」他还说:「在 Amazon Bedrock 上发布 1.0 版本表明我们与 AWS 紧密合作,为开发人员和客户提供最佳解决方案。

Stable Diffusion XL 1.0 GitHub:

https://github.com/Stability-AI/generative-models

举报

  • 相关推荐
  • “人工智能+消费”信号已明确,睡眠行业如何接棒?

    12月5日,商务部部长王文涛围绕“十四五”规划中“建设强大国内市场”与“大力提振消费”的核心部署,进一步阐释了具体路径。他特别指出,要着力推动“人工智能+消费”,并“释放绿色、智能等消费潜力”。这一政策信号,为众多产业的转型升级与未来发展提供了重要指引。尤其对于与日常生活息息相关的智能家居领域而言,未来的重点已不单是应用技术,更在于如何将“智能”切实转化为用户可感知的健康价值。在这一趋势下,行业关注的焦点逐渐从提供普适性的助眠放松,转向致力于解决与睡眠质量紧密相连的具体健康痛点。其中,脊柱健康问题成为一个极具代表性的突破口。现代社会的工

  • 第二届“兴智杯”总决赛暨人工智能赋能应用与创新生态活动成功举办

    第二届“兴智杯”全国人工智能创新应用大赛总决赛暨人工智能赋能应用与创新生态活动于2025年12月14-15日在深圳前海宝安片区举行。活动由中国信通院、深圳市人工智能产业办公室等单位主办,吸引了6000余支团队、1.8万余人参赛,覆盖全国及多个国家。大赛聚焦大模型创新、行业赋能等关键领域,通过专题赛和总决赛的激烈角逐,评选出优胜团队。活动期间举办了颁奖典礼及赋能应用与创新生态论坛,政府、企业、高校等各界嘉宾共同探讨AI技术创新趋势与应用落地路径,并发布大赛特色成果。论坛吸引三万余人线上观看,展现了我国人工智能产业的创新活力与发展潜力。

  • 响应“人工智能+消费”命题,AI喜临门打响价值升级战

    近期,两项高规格政策为智能睡眠行业指明发展路径。商务部和工信部等六部门分别提出推动“人工智能+消费”,并鼓励开发脑机接口等人工智能终端用于健康服务,开展智能家居大规模推广行动。政策聚焦脑机接口等前沿技术,推动行业向更深层次突破。喜临门与强脑科技(BrainCo)合作推出全球首款脑机接口AI床垫“宝褓·BrainCo”,首次将非侵入式脑电技术引入民用睡眠产品,旨在更直接评估睡眠状态和干预可能。这一实践呼应了政策鼓励的方向。同时,喜临门旗下aise宝褓率先通过国家《家具+智能等级评定及标识》标准,成为首个获得最高L4级认证的智能床垫品牌。行业努力方向已发生变化,不再满足于让床垫多几个调节模式或附加功能,而是开始朝着精准提升睡眠质量进化。政策已为智能睡眠行业勾勒出发展框架,真正的机会在于能否沿着这条确定的道路,通过不断投入研发和开放式协作,将智能化稳步转化为用户每晚可感知、可信任的健康价值。

  • 趣链科技亮相2025智链·医疗人工智能生态大会

    近日,2025智链·医疗人工智能生态大会暨武汉数智病理发展大会在武汉举行。趣链科技携数字医疗领域最新应用亮相,聚焦数据要素在医疗场景下的安全流通与价值释放。其展示的“医疗可信数据空间”与“医疗高质量数据集平台”两大核心应用,通过“区块链+隐私计算”技术,助力机构在保障隐私前提下开展联合建模与科研协作,同时为AI训练提供标准化、高质量的数据支撑,推动智慧医疗高质量发展。

  • 中关村AI北纬社区发布 北京市首个人工智能OPC服务计划

    随着人工智能技术加速演进与创业模式持续创新,“一人创业公司”(OPC)正成为推动“人工智能+”行动落地的重要创新力量。12月8日,中关村AI北纬社区联动海淀校友驿站、海淀大学生实习实践平台、AI北纬社区夜校,正式发布北京市首个人工智能OPC服务计划,探索打造人工智能OPC友好社区,让更多青年创业者“在这里,用AI孵化AI”,定义AI的千万种可能。

  • 智汇瓯江 智引未来:2025中国人工智能数字创新大会在温州成功举办

    2025年12月13-14日,由中国人工智能学会等主办的2025中国人工智能数字创新大会在浙江温州召开。大会以“智汇瓯江 智引未来”为主题,汇聚了戴琼海、刘大响、胡德文等多位院士及全国高校、科研院所、企业的专家学者,围绕低空经济、具身智能、通信网络、超图计算等前沿领域展开深入交流。会议发布了系列白皮书、行业国家标准等重要成果,并举行了多个AI与数字创新领域人才、科研、产业机构的揭牌仪式。大会还设置了专题会议、同期活动及AI互动体验展,全景呈现了人工智能从技术到产业应用的全链条发展蓝图,旨在推动人工智能与实体经济的深度融合,助力数字中国建设。

  • AI创新能力再获认可!易鑫获评智通财经“最具价值人工智能公司”

    易鑫集团在第十届智通财经资本市场年会上荣获“最具价值人工智能公司奖”,彰显了业界对其AI技术实力与产业贡献的高度认可。作为AI驱动的金融科技平台,易鑫自2018年起便将AI应用于风控与业务环节,2024年成为汽车金融领域首个通过生成式AI大模型备案的企业,率先实现业务全场景的AI规模化应用。今年公司AI创新持续加速,开源高性能推理模型,并发布行业首个Agentic大模型,赋能从获客、风控至客服、资管的全链路智能化决策。此次获奖不仅是对易鑫科技实力的肯定,更凸显了AI在汽车金融行业的价值创造潜力。

  • 园区成功举办“华为云杯”2025人工智能OPC应用创新大赛

    近年来,大模型技术爆发,基础设施、工程能力、数据质量和应用不断完善,推动人工智能更具推理和行动能力,深入制造、能源、医疗、城市治理等场景,解决复杂问题。政府与企业合作“搭台子”,加速AI创新和人才培养。12月4日,“华为云杯”2025人工智能OPC应用创新大赛在苏州工业园区举行,聚焦自主决策AI、工业物联网、智能硬件等方向,提出“OPC(个人+AI员工即公司)”理念,吸引众多团队参与。苏州工业园区作为全国首个聚焦人工智能产业的园区,已集聚相关企业超1800家,产业规模突破千亿元,并通过政策支持、搭建基础设施、构建产业生态,形成“筑巢引凤”良好态势。大赛成为汇聚创新要素、推动项目落地的重要平台,未来将持续完善创新孵化机制,营造繁荣的创新创业环境,为人工智能产业发展注入新活力。

  • 风磐科技入驻AI·镜界南京人工智能生态街

    11月23日,南京人工智能生态街区在软件谷开街,江苏风掣科技入驻并与中兴、华为等数十家企业共同开启AI新篇章。活动由南京市领导及工信部门负责人出席,风掣科技展示了自主研发的磐石智能分析系统,具备200TOPS算力、国产化支持及灵活部署能力,应用于应急布防、智慧安防等领域,助力产业国产化。街区聚焦智能引领与场景示范,推动AI与软件产业深度融合,打造创新生态体系。

  • AI日报:北京发布人工智能产业白皮书;字节发布视频编辑模型Vidi2;快手将发布Kling Omni

    本期AI日报聚焦多项AI领域进展:北京发布人工智能产业白皮书,预计2025年核心产值超4500亿元;字节跳动推出120亿参数视频模型Vidi2,实现视频编辑自动化;西藏首个千亿参数藏语大模型“阳光清言”问世,助力高原AI发展;快手Kling Omni即将发布,支持导演级精准控制,可生成2分钟带原生音频长视频;Meta推出Matrix框架,革新多智能体合成数据生成;国产家庭机器人F1亮相,具备多项家务能力,计划明年上市;豆包App升级语音功能,支持四种方言对话,提升老年人使用体验;豆包手机助手技术预览版发布,旨在提供更高效交互。

今日大家都在搜的词: