首页 > 业界 > 关键词  > UFOGen最新资讯  > 正文

谷歌推扩散模型变种UFOGen 真正实现一步文生图

2023-11-20 14:35 · 稿源:站长之家

要点:

1. 谷歌研究团队提出了一种名为UFOGen的扩散模型变种,只需要一步就能生成高质量的图片。

2. UFOGen通过改变生成器的参数化方式和重构损失函数的计算方式,理论上可以实现一步生成。

3. UFOGen的生成器和判别器都是由Stable Diffusion模型初始化,这样可以最大限度地利用Stable Diffusion的内部信息。

站长之家(ChinaZ.com)11月20日 消息:近年来,扩散模型在视觉创作领域的应用不断增加,但是生成速度一直是一个问题。然而,随着技术的进步,UFOGen模型的出现解决了这个问题,它只需要一步就能生成高质量的图片。通过改变生成器的参数化方式和重构损失函数的计算方式,UFOGen实现了一步生成的目标。

image.png

论文地址:https://arxiv.org/pdf/2311.09257.pdf

之前对扩散模型生成速度的研究主要集中在两个方向,一方面是利用更少的离散步数求解扩散模型的采样ODE,另一方面是利用知识蒸馏的方法将采样路径压缩到更小的步数。然而,谷歌的研究团队在UFOGen模型中采用了一种全新的思路,通过改变生成器的参数化方式和重构损失函数的计算方式来实现一步生成的目标。

image.png

UFOGen模型是在扩散模型和GAN混合模型的基础上发展而来的。扩散模型假设降噪分布是一个简单的高斯分布,但这种假设只在降噪步长趋于0时成立,导致生成速度很慢。而UFOGen模型通过使用带条件的GAN来模拟降噪分布,取较大的降噪步长来减少步数,从而提高了生成速度。

举报

  • 相关推荐
  • 易鑫正式发布汽车金融行业首个Agentic大模型

    易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿,响应延迟低于200毫秒,支持语音实时交互,单卡吞吐达370 tokens/秒,可提升获客、风控与运营效率,解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台,研发投入超20亿元,率先实现AI全场景应用,将持续推动智能汽车金融生态建设。

  • 软件定义汽车的质量革命:AI Agent如何终结座舱OTA的“路测噩梦”

    在“软件定义汽车”浪潮下,智能汽车竞争核心转向座舱体验、ADAS功能及OTA迭代质量。然而,传统软件测试模式成本高、耗时长,难以覆盖复杂场景,易导致漏洞。AI驱动的“无人测试”通过大模型与智能体技术实现三大突破:需求自主解析与测试规划、GUI自主探索与自愈维护、智能诊断与根因分析。这将催生“人机协同”新范式,测试工程师角色转向质量策略师。到2027年,超80%企业将集成AI测试工具,汽车行业2025年成为转型关键节点。

  • 高通骁龙8 Gen5本月底亮相:一加全球首发

    高通骁龙8 Gen5芯片暂定11月底发布,由一加首发搭载。除了一加,vivo、魅族、iQOO、moto等品牌也将使用骁龙8 Gen5芯片。 据悉,高通骁龙8 Gen5由一加和高通联合定义,这颗芯片采用台积电3nm工艺(N3P)制程,配备Oryon CPU,由2*3.8GHz超大核 6*3.32GHz大核组成,并集成Adreno 840 GPU。 跑分方面,骁龙8 Gen5的安兔兔总成绩突破3

  • 国内首个!火山引擎推出融合国家级智库理论与大规模实战验证的 Data Agent 评测体系

    火山引擎推出国内首个融合国家智库理论框架与大规模实战验证的数据智能体评测体系,同步发布《2025数据智能体实践指南》。该体系直面传统评测重技术轻业务、预设答案难适配动态场景、局部能力检验不足三大痛点,确立业务关联性、可操作性与前瞻性设计原则。覆盖分析洞察、可视化呈现、鲁棒性三大核心维度,通过151道测试题量化智能体能力并划分达标/工业可用/专业研究三级标准。采用标准化闭环流程与自动化评分机制,为数字化转型深水区企业提供选型优化依据,推动产业智能化进入精准量化新阶段。

  • MiniMax M2:所有坑都踩过,才能做出所有人都能用上的Agent

    最近一个月,基础模型似乎又有点多起来。但若仔细去看这些模型厂商的动作,大体还是走出了两条路。 一种是在诸多难点里选择一个死磕,成为这个单点上的SOTA。这种路线可以快速在开发者群体留下一个明确的印象,但也可能限制住了一家模型公司的“基座”属性。另一种则是在各个模态上全面前进,在一个最全面的基础模型蓝图里不停交出一个个关键拼图。 已经有了全

  • 零一万物联合开源中国推出OAK平台,目标打造Agent世界的“生态适配器”

    在GOT C 2025全球开源技术峰会上,零一万物CEO李开复博士发表演讲,强调开源模型是构建AI Agent的最佳选择。零一万物与开源中国联合发布一站式AI Agent开源开发平台OAK,支持对接多种开源大模型,旨在打破生态绑定限制,助力开发者实现“Agent开发自由”。该平台具备可视化编排、评估优化、数据管理等功能,未来将逐步推出四大核心模块,推动开放协作的AI Agent生态发展。

  • 数巅完成数亿元pre-A轮融资,领跑企业级AI Agent赛道

    北京数巅科技完成数亿元Pre-A轮融资,由济和创投与赛富基金领投。资金将用于产品研发、国内市场深耕及国际市场拓展,强化其Data Agent技术在行业落地方面的领先优势。数巅推出企业级Data Agent解决方案,通过模块化架构整合海量行业知识与企业数据,精准识别用户需求,实现秒级响应与深度推理,满足企业数据分析、智能报告生成及业务决策等需求。该方案已在多家央国企及金融机构落地,查数准确率超99%,成为国内企业级智能体应用的重要里程碑。

  • AI日报:HeyGen发布AI视频翻译引擎;科大讯飞推星火 X1.5;QQ浏览器推出AI+小窗

    本期AI日报聚焦多项技术突破:HeyGen推出精准唇形同步的视频翻译引擎;科大讯飞发布星火X1.5大模型,提升多语言处理能力;QQ浏览器新增AI助手浮窗;科大讯飞推出软硬一体方案,实现高噪声环境精准识别;谷歌Gemini 3 Pro预览版支持百万级上下文窗口;Comfy Cloud让Stable Diffusion实现零门槛创作;谷歌Gemini新增深度研究功能,可整合邮件生成智能报告;上海AgiBot机器人10分钟完成复杂制造任务,重塑生产效率。

  • 蝉妈妈AI新品震撼发布:电商营销Agent时代来临,6万+从业者共寻增长新引擎

    2025年电商竞争核心转向AI效率。蝉妈妈于10月23日发布电商专属AI工具,旨在解决传统运营痛点。该工具覆盖全链路场景:从行业分析、竞对数据到图文创作、视频脚本生成,帮助从业者实现策略制定到落地执行的一站式智能运营。发布会集结多位实战专家,分享全域增长、内容提效等可复用的方法论,吸引超6万观众。蝉妈妈凭借行业数据沉淀与AI技术结合,为电商从业者提供突破增长瓶颈的系统路径,推动行业迈向技术驱动的高效新纪元。

  • 一加全球首发高通骁龙8 Gen5:一加高通联合打造

    一加中国区总裁李杰在一加15新品发布会后接受了媒体群访,他在群访环节透露了一加骁龙8 Gen5的消息。 李杰表示,骁龙8 Gen5将在一款非常重磅的机型上首发搭载,这款芯片由一加和高通双方共同定义,研发两年之久,很快就会来。 据悉,骁龙8 Gen5采用了高通自研的Oryon CPU,主频超4.0GHz,基于台积电第三代3nm制程N3P工艺制造,并集成Adreno GPU,其安兔兔成绩突破340万分,比骁�

今日大家都在搜的词: