Deci AI推出8.2亿参数的文本到图像潜在扩散模型DeciDiffusion 1.0

2023-09-25 10:13 · 稿源：站长之家

要点:
1. Deci AI推出DeciDiffusion1.0，这是一个具有8.2亿参数的文本到图像潜在扩散模型，速度比稳定扩散快3倍。
2. DeciDiffusion1.0采用创新的U-Net-NAS架构，以更高效的方式生成高质量图像，并通过四阶段的培训过程优化了样本效率和计算速度。
3. 研究团队进行了用户研究，发现DeciDiffusion1.0在图像美学方面具有优势，同时在与文本描述的匹配方面与Stable Diffusion1.5相媲美，为文本到图像生成领域带来了新的创新。

站长之家（ChinaZ.com）9月25日消息:Deci AI最近推出了DeciDiffusion1.0，这是一项令人振奋的创新，旨在解决文本到图像生成领域的挑战。长期以来，将文本描述转化为栩栩如生的图像一直是人工智能领域的难题，因为这涉及到自然语言理解和视觉内容创建之间的巨大差距。研究人员一直在努力开发高效且有效的模型来实现这一目标。

DeciDiffusion1.0采用了一种全新的方法，通过一系列关键创新使其脱颖而出。其中一个关键创新是将传统的U-Net架构替换为更高效的U-Net-NAS架构。这种架构变化降低了参数数量，同时提高了性能，使得模型能够更高效地生成高质量的图像。

项目地址:https://huggingface.co/spaces/Deci/DeciDiffusion-v1-0

这个模型的训练过程也非常值得注意。它经历了四个阶段的培训过程，以优化样本效率和计算速度。这一方法对于确保模型能够在更少的迭代次数内生成图像至关重要，从而使其在实际应用中更加实用。

DeciDiffusion1.0的技术核心包括使用变分自动编码器（VAE）和CLIP的预训练文本编码器。这个组合使模型能够有效地理解文本描述并将其转化为视觉表示。该模型的一个关键成就是其能够生成高质量的图像，同时迭代次数更少。这意味着DeciDiffusion1.0在样本效率方面表现出色，能够更快地生成逼真的图像。

研究团队进行了用户研究，以评估DeciDiffusion1.0的性能。研究使用了一组10个提示，将DeciDiffusion1.0与Stable Diffusion1.5进行了比较，为美学和提示对齐提供了宝贵的见解。研究结果显示，DeciDiffusion1.0在图像美学方面具有优势。与Stable Diffusion1.5相比，DeciDiffusion1.0在30次迭代时始终生成更具吸引力的图像。然而，值得注意的是，在50次迭代时，与提供的文本描述相匹配的能力与Stable Diffusion1.5相当。这表明DeciDiffusion1.0在效率和质量之间取得了平衡。

总之，DeciDiffusion1.0是文本到图像生成领域的一项令人瞩目的创新。它解决了长期存在的问题，并提供了有希望的解决方案。通过将U-Net架构替换为U-Net-NAS并优化训练过程，研究团队创建了一个不仅能够生成高质量图像，而且在效率上更加出色的模型。用户研究结果强调了该模型的优势，特别是在图像美学方面的表现。这是使文本到图像生成更加易于访问和实用于各种应用的重要一步。尽管仍然存在挑战，如处理非英文提示和解决潜在偏见等问题，但DeciDiffusion1.0代表了将自然语言理解与视觉内容创建融合的里程碑。

这个创新证明了创新思维和先进培训技术在不断发展的人工智能领域的力量。随着研究人员继续推动AI能够实现的界限，我们可以期待进一步的突破，使我们更接近一个世界，其中文本无缝地转化为引人入胜的图像，从而在各个行业和领域带来新的可能性。

（举报）

相关推荐

关键词：

算力无界，AI无距！超聚变发布FusionXpark™随身智能体开发平台

10月24日，超聚变公司发布FusionXpark™智能体开发平台，实现AI算力从云端下沉至桌面设备。该平台搭载GB10架构，提供1PFLOPS本地算力，支持200B参数模型推理，助力开发者在边缘端运行高参数模型。发布会展示了政务、金融、工业等五大行业的30类“超级员工”智能体应用，通过私有化部署保障数据安全。专家指出，这一创新将推动AI普惠化，重塑产业生态。

AI原生计算智能体开发平台 FusionXpark
一图读懂FusionXpark™随身智能体开发平台

文章搜索核心标签内容检索
平安云原生AI算力资源调度平台，荣获IDC “AI-就绪数字基础设施领军者优秀奖”

近日，IDC公布2025年中国未来企业大奖获奖名单，平安科技打造的《云原生AI算力资源调度平台》创新项目荣获“AI就绪数字基础设施领军者优秀奖”。该平台通过统一资源池化管理、动态调度及GPU虚拟化等技术，显著提升资源利用率约30%，降低运营成本，并支持金融级高可用与弹性伸缩，助力企业高效应对AI推理与训练场景需求，体现了平安在AI基础设施构建与产业赋能方面的技术实力与国际认可。

AI算力云原生数字基础设施
快手进军AI Coding，开发工具、模型和Maas平台齐登场

10月23日，快手StreamLake发布全新AI编程产品矩阵，以“工具+模型+平台”三位一体战略布局AI Coding领域。核心产品包括智能开发助手CodeFlicker、自研高性能编码模型KAT-Coder系列及企业级服务平台快手万擎。CodeFlicker提供全流程开发支持，KAT-Coder在权威测试中性能超越GPT-5，平台保障99.95%服务可用性。该生态旨在通过技术普惠，为企业与开发者提供颠覆性研发体验，推动AI编程普及。

AI编程快手StreamLake CodeFlicker
以算力为基，优刻得与IDEA共建低空经济新格局

10月24日，粤港澳大湾区数字经济研究院低空经济院长李世鹏一行访问优刻得上海总部，与董事长季昕华、副总裁韩畅交流。双方围绕低空经济发展趋势、技术攻关及生态共建等达成多项合作意向，将共同推动低空经济产业创新与落地。此前中共二十届四中全会提出加快低空经济等新兴产业发展。双方团队将在技术产品创新、生态共建与全球化布局等领域深化合作，整合云计算与产业资源优势，促进低空经济全链条发展，把握战略机遇，引领产业健康、智能、可持续发展新阶段。

低空经济数字经济战略性新兴产业
超擎速度！全国首批NVIDIA DGX Spark率先抵达超擎数智，现货在仓，交付启动

10月19日，全国首批NVIDIA DGX Spark桌面级AI超算率先抵达超擎数智并开始交付。这款"全球最小AI超算"在发布72小时内落地中国市场，为企业和科研机构提供强劲算力。产品预装完整AI软件栈，实现开箱即用，配备详细快速指南和专业支持团队，助力开发者无缝对接顶尖计算能力，加速AI本地化开发创新。

NVIDIA DGX Spark
苹果发布Vision Pro新配件：双圈编织头带售价799元

在发布搭载M5芯片的新款Vision Pro之际，苹果同步推出了一款全新设计的双圈编织头带，售价为799元。该头带上下两层均采用一体成型的3D针织工艺，构成独特的双罗纹结构，在提供有效缓冲的同时，兼具良好透气性与弹性。下层表带选用弹性织物罗纹，并创新嵌入钨丝配件，通过产生均衡的约束力

苹果 Vision Pro
荐AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将推Nano Banana2

本期AI日报聚焦多领域突破：OpenAI视频应用Sora登陆安卓平台并引入付费角色功能；网易云音乐推出AI调音大师实现智能音效适配；字节跳动高薪布局人形机器人赛道；谷歌Gemini平台将升级图像生成技术；llama.cpp实现多模态革命；特斯拉秘密实验室通过行为数据训练机器人；上海首例AI著作权案宣判保护原创；微软推出自研图像生成器MAI-Image-1，在创意效率与质量间取得平衡。

OpenAI Sora Android
荐AI日报：Hailuo 2.3发布；豆包AI编程史诗级升级；马斯克推出AI百科全书Grokipedia

本期AI日报聚焦多领域突破：海螺AI 2.3实现视频生成技术跃升，支持双模式免费试用；豆包AI编程工具实现零基础可视化开发；马斯克推出AI百科Grokipedia；Mistral发布企业级AI开发平台；Anthropic推出金融版Claude，显著提升分析师效率；Pinterest升级AI购物助手功能；英伟达推出全能模型OmniVinci刷新性能纪录；DeepSeek模型在港大美股交易竞赛中以10.61%年化回报率夺冠。

AI视频生成 Hailuo 2.3
石化盈科联合IDC发布《“新”型工业 “智”变运营——石油石化新智运营白皮书》

2025年10月17日，石化盈科与IDC联合发布《石油石化新智运营白皮书》，首次系统性提出“新智运营”概念。该理念以数字化、智能化技术为基石，通过“智能感知、平台、决策”三大核心能力，构建覆盖全产业链的“数据×知识”双轮驱动运营体系，推动管理、研发、生产与服务模式创新，旨在实现高端化、智能化、绿色化发展目标，助力行业应对能源转型与全球化竞争挑战。

石油石化新智运营数字化转型

今日大家都在搜的词：

热文

3 天
7天

Deci AI推出8.2亿参数的文本到图像潜在扩散模型DeciDiffusion 1.0

算力无界，AI无距！超聚变发布FusionXpark™随身智能体开发平台

一图读懂FusionXpark™随身智能体开发平台

平安云原生AI算力资源调度平台，荣获IDC “AI-就绪数字基础设施领军者优秀奖”

快手进军AI Coding，开发工具、模型和Maas平台齐登场

以算力为基，优刻得与IDEA共建低空经济新格局

超擎速度！全国首批NVIDIA DGX Spark率先抵达超擎数智，现货在仓，交付启动

苹果发布Vision Pro新配件：双圈编织头带售价799元

荐AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将推Nano Banana2

荐AI日报：Hailuo 2.3发布；豆包AI编程史诗级升级；马斯克推出AI百科全书Grokipedia

石化盈科联合IDC发布《“新”型工业 “智”变运营——石油石化新智运营白皮书》

今日大家都在搜的词：

热文

鸿蒙HarmonyOS 6与iOS数据互传功能预计12月上线

AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功

DeepSeek崩了上热搜页面显示“服务器繁忙”

特斯拉Cybercab不配备方向盘和踏板预计2026年二季度下线

阿里回应饿了么更名：正处于灰度测试阶段

OPPO ColorOS 16正式版11月升级机型公布：支持23款机型

何小鹏：小鹏X9超级增程是全球续航最长的大七座车

马斯克称若发现外星人证据就公开

AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear

卢伟冰评Air手机：大胆创新但极致薄牺牲用户体验

鸿蒙HarmonyOS 6与iOS数据互传功能预计12月上线

AI日报：Sora免费额度要缩水；月之暗面发布Kimi Linear架构；C

苹果客服回应iPhone或自动拨号：设置或其他问题

AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功

小米随身蓝牙音箱曜石黑配色版本开售：售价299元

DeepSeek崩了上热搜页面显示“服务器繁忙”

iQOO Neo11开售2小时销量超前代全天

特斯拉Cybercab不配备方向盘和踏板预计2026年二季度下线

iQOO 15旷野配色今日开售：售价4999元首发2K三星珠峰屏

vivo WATCH GT 2已支持开通移动/联通eSIM服务

站长商机