首页 > 业界 > 关键词  > SD3-Turbo最新资讯  > 正文

SD3-Turbo:基于LADD的快速文本到图像生成模型

2024-03-19 14:12 · 稿源:站长之家

站长之家(ChinaZ.com)3月19日 消息:SD3模型还未发布,SD3-Turbo又来了!近日,一篇关于SD3-Turbo的论文引起了广泛关注。该论文主要介绍了Stability AI升级过的蒸馏技术LADD,以及其在SD3-Turbo模型上的应用效果。

LADD(Latent Diffusion Model Distillation)是对原有ADD(Activation Distillation Distillation)技术的改进。原有的ADD技术基于像素级别进行操作,而LADD则利用了预训练的潜在扩散模型中的生成特性。这种策略不仅简化了训练流程,还显著提高了性能。

image.png

论文地址:https://arxiv.org/html/2403.12015v1

具体来说,LADD能够有效克服了ADD的限制,使得我们能够生成高分辨率、多宽高比的图像。这一特性在图像生成领域具有重要意义,因为它能够提高生成图像的质量,同时保持较高的效率。

将LADD应用于“稳定扩散3(8B版)”,开发出了SD3-Turbo这一快速模型。令人惊喜的是,SD3-Turbo仅需四步无指导采样,就能达到与当今最先进的文本到图像生成器相媲美的性能。这意味着,SD3-Turbo能够在较短的时间内,生成高质量的图像,大大提高了生产效率。

SD3-Turbo是一个基于LADD的快速文本到图像生成模型,它通过利用预训练的潜在扩散模型中的生成特性,简化了训练流程,提高了性能。这一模型的发布,无疑将为图像生成领域带来新的突破。

举报

  • 相关推荐
  • ThinkBook 16+ U7-255H对比AI 9 H365:酷睿优势显著,校园场景体验更佳

    ThinkBook 16+ 2025款搭载酷睿Ultra 7 255H和锐龙AI 9 H365处理器,性能对比显示酷睿版在核心性能、图形处理、AI算力、续航及屏幕亮度等方面全面领先。酷睿版凭借更高主频、更强核显及AI加速技术,在校园学习、多任务处理及游戏场景中表现更优,且价格更具性价比,适合学生和职场新人选择。

  • 微软发布AI截图工具,截图一键转PPT

    微软电脑管家推出全新“智能圈选”功能,通过AI技术实现截图内容的智能识别与重构。用户只需圈选截图区域,即可一键完成文字提取、多语言翻译及PPT转换等操作,大幅提升办公和学习效率。该功能支持100多种语言,保留原始格式,并能智能修复遮挡内容,彻底改变了传统截图处理方式。

  • 小米澎湃OS 3首批Beta版更新“3.0.0.24”发布

    今日,小米正式向旗下8款机型推送了澎湃OS3的首批Beta版升级,涵盖小米15、小米15Pro、小米15S Pro、小米15Ultra、REDMI K80Pro、REDMI K80至尊版、小米平板7Pro以及小米平板7S Pro12.5。此次更新不仅修复了用户反馈的多项系统问题,还新增了实用功能,并对相机稳定性进行了优化。 在系统层面,小米澎湃OS3解决了部分场景下多应用音量调节异常、应用双开时无法切换输入法、点击消息�

  • 从模态融合到高效检索:微算法科技 (NASDAQ:MLGO)CSS场景下的图卷积哈希方法全解析

    在信息爆炸时代,计算社会科学对多模态数据高效检索需求激增。传统方法面临依赖人工标注、忽视邻近信息及实值特征映射效率低等挑战。微算法科技开发了无监督稳健的图卷积哈希算法框架,通过二次语义融合、自适应计算策略和哈希学习结合,实现高效鲁棒的多模态检索。该技术减少人工依赖,提升特征鲁棒性和检索效率,为计算社会科学提供有力数据支持。

  • 小米14无缘澎湃OS 3首批Beta版:张国全解释原因

    小米软件部张国全发文表示,澎湃OS 3 Beta版第二版今天已经外发,欢迎大家升级体验,如果没有重大问题,8款机型第二批Beta版明天逐步外发。 值得注意的是,12306行程助手明天开始外发(澎湃OS 2/OS 3同时外发),NFC上岛/秒表上岛,第一版开始外发,大家升级试用后有问题随时反馈。 张国全还提到了小米14系列Beta版计划,称去年在规划澎湃OS 3 Beta版的时候,怕大家觉得不公�

  • 倍思 Inspire系列重磅发布!携手Sound by Bose重新定义专业音频,售价799元起

    2025年9月5日,倍思与Bose联合发布Inspire系列三款旗舰音频新品:全球首款圈铁双单元耳夹耳机XC1、真无线降噪耳机XP1及头戴式降噪蓝牙耳机XH1。新品融合Bose声学技术,支持Hi-Res认证、LDAC高清解码,主打专业音质与舒适佩戴。价格亲民(XC1补后764元,XH1补后849元,XP1补后679元),旨在打破高端音频价格壁垒,让专业音质走进大众生活。即日起开启预售,9月12日正式发售。

  • 澎湃OS 3第二批Beta来了!小米回应推送时间

    小米澎湃OS3首批Beta版内测已于8月29日开启推送。 今日,小米澎湃OS官方就大家关心的第二批Beta版(首批Beta版机型)推送时间作出回应。 官方表示,即使推送Beta版本也极为重视交付质量,为了给参与Beta招募的用户提供良好可靠的使用体验,小米社区会按照用户提交招募申请的先后顺序,分两批逐步放量推送,这一举措将提供更充分的质量保障。 当前,由于用户报名热情,�

  • B站要变成AI站

    互联网平台都在跟AI结合,B站没有成为例外。从新一季度财报来看,B站的AI味儿也越来越浓了。 8月21日,B站公布第二季度业绩,总营收达73.4亿元人民币,同比增长20%。其中,游戏业务收入为16.1亿元,同比增长60%,广告业务收入为24.5亿元,同比增长20%。由此推动B站毛利率从去年同期的29.9%提升至36.5%,调整后净利润达到5.6亿元,创下历史最好成绩。 从整体来看,B站生态集聚

  • AI日报:抖音打击AI技术滥用行为;OpenAI 收购开发数据分析平台 Statsig;ElevenLabs 音效模型更新

    抖音打击AI技术滥用行为,对违规商家和达人采取下架、清退等措施。ElevenLabs音效模型升级至版本2,支持长音频和无缝循环。OpenAI收购数据分析平台Statsig,增强产品迭代能力。亚马逊推出Lens Live AI功能,实时扫描购物。谷歌AI推出Stax工具,帮助开发者评估大语言模型。WordPress推出AI工具Telex简化网站构建。Liquid AI发布LFM2-VL模型,提升手机视觉语言处理。苹果开源FastVLM与MobileCLIP2模型,优化边缘设备AI应用。MetaGPT推出自动化测试工具RealDevWorld,精准率达92%。瑞士发布开源大模型Apertus,提供多语言处理能力。

  • AI日报:钉钉十周年发布8.0版本;微信悄悄上线AI播客;阿里开源 Mobile-Agent 3

    AI日报栏目聚焦人工智能领域最新动态。钉钉发布8.0版本推出AI办公应用钉钉ONE,通过自然语言交互简化工作流程;阿里开源Mobile-Agent-v3跨平台代理框架;微信测试AI播客功能,实现双人对话式新闻播报;钉钉推出首款AI硬件录音笔DingTalk A1;苹果拟为Siri引入谷歌Gemini大模型;苹果发布适配版SlowFast-LLaVA模型提升长视频分析性能;Meta获得Midjourney技术授权加强AI图像生成竞争力;谷歌Drive新增Vids视频编辑功能降低制作门槛;夸克发布健康大模型通过12学科主治医师测评;AI小游戏Draw A Fish凭借极简设计引发全球热潮。

今日大家都在搜的词: