首页 > 业界 > 关键词  > instaflow最新资讯  > 正文

instaflow:利用校正流技术加快将文本转化为图像的过程

2023-09-15 10:19 · 稿源:站长之家

站长之家(ChinaZ.com)9月15日 消息:InstaFlow是一个快速、一步生成图像的模型,能够以接近Stable Diffusion的图像质量显著减少计算资源需求。这种高效率源自最近的Rectified Flow技术,它训练具有直线轨迹的概率流,因此本质上只需要一步即可进行快速推理。

image.png

项目地址:https://github.com/gnobitab/instaflow

InstaFlow具有几个优点:

极快推理:InstaFlow模型是一步生成器,它直接将噪声映射到图像,避免了弥散模型的多步采样。 在我们的A100GPU机器上,推理时间约为0.1秒,与原始Stable Diffusion相比可节省约90%的推理时间。

高质量:InstaFlow生成具有Stable Diffusion那样复杂细节的图像,在MS COCO2014数据集上的FID与最先进的文本到图像GAN(如StyleGAN-T)相当。

简单高效的训练:InstaFlow的训练过程只涉及有监督训练。 借助预训练的Stable Diffusion,仅需199个A100GPU天即可获得InstaFlow-0.9B。

方法:用文本调整的反流整流生成概率流

image.png

流程包括三个步骤:

1. 从预训练的Stable Diffusion生成(文本,噪声,图像)三元组

2. 应用文本调整的反流生成2-Rectified Flow,这是一条整流的生成概率流。

3. 从2-Rectified Flow中迁移学习得到一步InstaFlow。 注意迁移学习和反流是正交的技术。

如视频和图像所示,直线流具有以下优点:

1. 直线流需要更少的步骤来模拟。

2. 直线流在噪声分布和图像分布之间提供了更好的耦合,因此允许成功的迁移学习。

InstaFlow的核心功能有:

- 快速一步生成

- 与Stable Diffusion相当的图像质量

- 简单高效的训练过程

- 利用文本调整的反流产生直线概率流

- 从直线流中迁移学习以实现一步生成

通过直线流和迁移学习,InstaFlow实现了快速生成高质量图像的目标,是新一代文本到图像生成模型的杰出代表。

举报

  • 相关推荐
  • 正浩EcoFlow发布德 DELTA 3 系列移动电源,全能王者再进化,极速充电智领行业

    清洁与智慧能源品牌正浩EcoFlow发布德DELTA3系列移动电源,包括德DELTA3、德DELTA3Plus、德DELTA31500三款适配各类用电需求的移动电源。德DELTA3系列搭载了正浩围绕性能、安全、智能三大用电核心研发的X-Core3.0技术平台的多项领先技术,拥有前所未有的最快56分钟充电速度、低至30dB超级静音效果、10毫秒专业UPS等关键能力,轻松应对日常行车、自驾露营、行业作业、家庭备电等用电全

  • Brillowel生发片:燕荚推荐,让你重拾浓密秀发

    在追求健康与美的道路上,我们总是在不断寻找,渴望找到那个能为我们提供全方位、个性化服务的贴心帮手。我要为大家介绍的,正是这样一个宝藏平台——燕荚。无论你是想要改善发质、减脂塑形还是解决其他健康困扰,燕荚都能为你提供专业的建议和服务。

  • 三星与 Instacart 携手合作,通过标志性创新提升厨房体验

    摘要:2025年新款Bespoke系列带屏幕冰箱将支持便捷的食品购物服务2025年1月2日,三星电子宣布与Instacart达成多年合作伙伴关系,双方携手为美国消费者带来全新的便捷购物方式[1],使其能够直接从三星Bespoke系列冰箱[2]的屏幕上购买食品。通过整合三星独家的AI食材识别以及Instacart先进的产品匹配应用程序接口[4],此次合作将为消费者提供以技术驱动的简单便捷食品购物体验。固件更新将在兼容的旧冰箱设备上提供。

  • 数字化为海底捞提升运营效率提供技术支撑,支持企业稳健发展

    数字化浪潮下,各行各业都在积极探索数字转型,通过数字技术升级来达到降本增效的目的。海底捞作为国际知名上市餐饮企业,积极拥抱数智化,全方位展开数字化技术的探索,为餐饮服务业发展“新质生产力”写下生动注脚。海底捞凭借在数字化领域的卓越表现,荣膺中国首批“BMC金奖企业”称号,也是唯一一家荣获此荣誉称号的餐饮企业。

  • 拼接日喀则地震信息 利用灾害博量!AI男孩被埋涉案人员被行拘

    快科技1月10日消息,1月7日9时5分,西藏定日县发生6.8级地震,牵动着许多网友的心,一系列小男孩被埋图”在网上广泛传播,并配文日喀则地震等关键词,有些甚至获得好几万的转评赞。据央视新闻报道,鉴于该图片存在明显AI生成痕迹,经查,上述图片确由AI工具创作,原作者在2024年11月18日发布了相同画面的短视频,并未关联地震且声明是AI生成。经查,青海某网民为博取眼球,将小男孩被埋图”与日喀则地震相关的信息进行关联拼凑、移花接木,混淆视听、误导群众,致使谣言信息传播扩散。目前,涉案人员已被属地公安机关依法行政拘留。专家指

  • Statter Network(STT):市场更欢迎全通和经济模型公平的项目

    尽管比特币在减半和各种利好因素推动下突破10万美元的历史新高,但就加密行业言,BTC仍然算不上是最耀眼的,今年最值得追捧的赛道即不是VC币也是不是以太坊扩容层是各大链上meme。其实并不难理解,meme币之所以受到加密投资者的欢迎主要得益于两个主要因素:公平发射和全流通。这种机制不仅能够确保每个参与者都能公平地获得STT代币能够有效降低能源消耗,提高网络安全性,并且比较容易被头部交易所看中。

  • 首款晶栈Xtacking 2.0技术!长江存储PE321 6.4TB SSD

    长江存储近日推出了PE321固态硬盘,凭借其第三代三维闪存技术,以高达6.4TB的容量引起了广泛关注。现在这款SSD已经来到我们评测室,下面为大家带来图赏。背面也板载了8颗闪存芯片、5颗内存芯片,以及一颗SSD主控、一颗用于掉电保护设计的大容量电容。

  • 一款“长在Instagram上”的App,上线3年赚了4000万美金

    一款长青的青少年匿名社交App。「NGL」是一款依托于Instagram进行匿名Q&A的App,白鲸编辑部在2022年6月首次观察到其登顶美国?iOS下载总榜。在商业化和风控的天平里,即使头部如「NGL」也依旧显得被动、难以平衡。

  • 网安标委2024年“标准周”活动顺利举行,合合信息AI助力图像鉴伪技术创新

    随着互联网在社会生活中的广泛应用,网络空间环境也变得日益复杂,网络安全标准成为维护网络秩序和公民权益的重要基石。近期,全国网络安全标准化技术委员会(以下简称“网安标委”) 2024 年第二次“标准周”活动在海南省海口市举办。活动由网安标委秘书处、中国电子技术标准化研究院、海南省委网信办共同承办。合合信息图像算法研发总监郭丰俊博士参与技术研讨会

  • SD3.5官方教程:5大重要框架,教你用文本生成精准

    很多小伙伴在使用SD3.5、DALL·E3、Midjourney、豆包等文生图模型时,总是感觉生成的图片和预期的相差甚远。今天就用Stability.ai发布的SD3.5官方教程为大家解读一下,如何用最贴切的文本提示词来生成精准的图片。文本提示案例:采用鸟瞰视角,从天空向下看一座繁华的城市夜景,街道灯火通明,车流不息,霓虹灯牌闪烁,给人一种现代都市的活力感。

热文