首页 > 业界 > 关键词  > StableDiffusion3最新资讯  > 正文

Stability AI发布SD3技术报告 披露SD3更多细节

2024-03-05 14:44 · 稿源:站长之家

站长之家(ChinaZ.com)3月5日 消息:Stability AI 最近发布了他们最强的图片生成模型 Stable Diffusion3(SD3) 的技术报告,披露了 SD3的更多细节。据 Stability AI 所说,SD3在排版质量、美学质量和提示词理解上超过了目前所有的开源模型和商业模型,是目前最强的图片生成模型。

image.png

技术报告要点如下:

根据人类偏好评估,SD3在排版质量和对提示的理解程度上,均优于目前最先进的文本生成图像系统,例如 DALL·E3、Midjourney v6和 Ideogram v1。

报告提出了新的多模态扩散 Transformer (Multimodal Diffusion Transformer, 简称 MMDiT) 架构,其使用独立的权重集分别表示图像和语言。与 SD3的先前版本相比,该架构改善了系统对文本的理解能力和拼写能力。

SD38B 大小的模型可以在 GTX409024G 显存上运行。此外,SD3将发布多个参数规模不等的模型方便在消费级硬件上运行,参数规模从800M 到8B。

SD3架构以 Diffusion Transformer (简称"DiT",参见 Peebles & Xie,2023)为基础。鉴于文本嵌入和图像嵌入在概念上存在较大差异,他们为这两种模态使用了独立的权重集。通过这种方法,信息得以在图像 Token 和文本 Token 之间流动,从而提高了模型生成结果的整体理解力和排版质量。

SD3采用了矫正流 (Rectified Flow, 简称 RF) 的公式,在训练过程中,数据和噪声被连接在一条线性轨迹上。这导致了更直的推理路径,从而可以使用更少的步骤进行采样。

他们还进行了扩展矫正流 Transformer 模型的研究,使用重新加权的 RF 公式和 MMDiT 主干网络,训练了一系列模型,其规模从15个 Transformer 块 (4.5亿参数) 到38个块 (80亿参数) 不等。

SD3还引入了灵活的文本编码器,通过在推理阶段移除内存密集型的 T5文本编码器(参数量高达47亿),SD3的内存占用可以大幅降低,而性能损失却很小。

总的来说,Stability AI 的这一技术报告揭示了 SD3的强大功能和细节,显示出其在图片生成领域的领先地位。

详细内容点此查看:https://stability.ai/news/stable-diffusion-3-research-paper

举报

  • 相关推荐
  • 小米澎湃OS 3首批Beta版正式推送!手机、平板8款机型升级

    根据小米社区网友反馈,小米澎湃OS3首批Beta版内测更新目前已开启推送。 有内测资格用户可以点击手机设置-我的设备-击版本号查看是否收到推送。 升级页面显示,小米15 Pro的澎湃OS3Beta安装包大小7.7GB,小米15 Ultra安装包大小9GB。

  • 豆包1.5 Vision Lite 对比 GPT-5-min,谁更适合你?实测AI模型选型利器|AIBase

    文章探讨了企业选择AI大模型时面临的实际决策难题,指出单纯比较学术参数无法满足业务需求。AIBase模型对比平台(https://model.aibase.cn/compare)通过三大核心价值解决痛点:1)聚焦业务场景而非参数堆砌,突出价格、语言支持、上下文长度等实用维度;2)透明化成本计算,标注长文本溢价规则和多模态附加费;3)一键生成对比报告。平台特别强调中文场景的特殊性(如豆包1.5在中文处理成本的优势),并揭示厂商宣传中容易忽略的隐藏成本(如GPT-5-min超5000字符的30%溢价)。典型电商客服案例显示,需综合中文理解、多模态、性价比等维度决策,最终选择取决于具体业务需求而非绝对性能排名。

  • 小米澎湃OS 3今日发布 首批29日启动Beta测试推送

    今日15:00,小米集团将正式发布新一代手机操作系统小米澎湃OS3,同步在小米社区开启Beta版招募通道。据官方披露,为保障系统稳定性与用户体验,本次测试将采取分批次推送策略,首批八款适配机型用户将于8月29日起陆续收到更新,第二批用户预计在首批推送后10天内完成升级。 此次纳入Beta测试的机型覆盖小米与REDMI双品牌旗舰,包括小米15系列四款机型(小米15、小米15Pro�

  • 每日互动GAI Station亮相2025数博会 新一代智能终端为企业落地AI保驾护航

    2025中国国际大数据产业博览会于8月27日在贵阳开幕,聚焦数据智能与产业融合。每日互动公司展示其AI拳头产品GAI+Station,这是一站式AI落地应用解决方案,集成算力与知识库,覆盖主流办公场景。同时推出AI机器狗,具备多模态交互能力。展会还呈现“数智绿波”等数据应用成果,提升交通效率20%以上。活动凸显大数据与人工智能深度融合,推动产业智能化升级。

  • 全球最轻的MR头显!vivo Vision探索版亮相:仅重398g

    今天下午,vivo Vision发布会暨影像盛典正式开启,vivo Vision探索版正式亮相,这是蓝厂首款MR头显。 vivo智慧终端产品总经理洪沂介绍,vivo Vision从一开始立项,减重”就是核心命题,因为太重的话大家就很难长时间沉浸体验。 目前市面上的大部分MR头显设备重量都超过了500g,苹果Vision Pro的重量甚至超过了600g,这次vivo Vision探索版的重量压缩至398g,是目前行业内最轻的MR头显。

  • 小米应用软件部总监:澎湃OS 3 Beta招募不设门槛、不设上限

    小米8月27日官宣澎湃OS3系统,将于28日正式发布,并同步开启Beta版招募。首批支持15款机型,招募无门槛限制,用户只需答题通过即可参与。系统以“顺”为核心目标,围绕AI生态展开。小米提醒此为测试版,可能存在bug,不建议主力机升级,希望用户多反馈意见以持续优化。

  • 小米澎湃OS3发布会官宣 首批Beta版招募机型公布

    今日,小米官方正式宣布,备受期待的小米澎湃OS3 将于 8 月 28 日正式发布,其Slogan定为“事事顺心”,预示着新系统将带来更加流畅、顺心的用户体验。与此同时,小米澎湃OS3 的Beta版招募活动也同步开启,用户可前往小米社区-内测中心进行报名。 此次Beta版招募的首批机型阵容强大,涵盖了六款手机和两款平板。手机方面包括小米15、小米15 Pro、小米15S Pro、小米15 Ultra、REDM

  • 小米澎湃OS 3 Beta推送计划发布:首批8月29日起推送 看看有你手机没

    今日,小米澎湃OS 3正式发布,同时发布Beta版推送计划。 据了解,Beta版首批机型将于8月29日开启陆续推送,更多机型将陆续覆盖,具体如下: 8月29日开启陆续推送 小米15、小米15 Pro、小米15S Pro、小米15 Ultra、REDMI K80 Pro、REDMI K80至尊版、小米平板7 Pro、小米平板7S Pro 12.5。 不晚于9月17日开启推送 小米MIX Flip 2、REDMI K80、小米平板7 Ultra、小米平板7、REDMI K Pad、小米电视S Pro Mini

  • 小米张国全回应澎湃OS 3 Beta版是否本月推出:不能说 很快!

    小米集团日前发布了第二季度财报,小米手机系统软件部总监张国全转发了该消息,并表示坚定投入核心技术,连续3个季度超千亿”。 有网友在评论区问到,澎湃OS 3 Beta版是否会在这个月推出,张国全回复称:不能说,很快”。另外,近期国产手机厂商都纷纷接入了12306,可以在系统内方便的展示购票信息。 也有网友问到了澎湃这边什么时候接入,张国全称:本来计划OS3一�

  • vivo Vision探索版发布 将于明日开放线下体验

    今日下午,vivo正式发布了备受瞩目的vivo Vision探索版MR头显,尽管该设备暂未确定上市销售时间,但已引发市场广泛关注。从8月22日起,北京、深圳等10余座城市的12家vivo官方授权体验店将率先开启抢先预约体验活动,后续还将有第二批线下体验门店加入,让更多消费者有机会亲身感受这款创新产品的魅力。

今日大家都在搜的词: