首页 > 业界 > 关键词  > AI实时绘画最新资讯  > 正文

AI实时绘画系统StreamMultiDiffusion 支持局部涂抹+提示生成图片

2024-03-15 14:58 · 稿源:站长之家

站长之家(ChinaZ.com)3月15日 消息:近期,一篇名为"StreamMultiDiffusion"的论文提出了一种新颖的实时、交互式的文本到图像生成系统。这种系统能够根据用户提供的手绘区域和相应的语义文本提示来生成图像,为专业图像创作者提供了一个强大的工具,可以用于快速原型设计和创意探索。

image.png

项目地址:https://github.com/ironjr/StreamMultiDiffusion

扩散模型在文本到图像合成领域取得了巨大成功,成为了图像生成和编辑的有前途的候选者。然而,将这些模型用于实际应用仍面临两大挑战:一是需要更快的推理速度,二是需要更智能的模型控制。这两个目标需要同时满足,才能在实际应用中发挥作用。为了解决这些挑战,作者提出了StreamMultiDiffusion框架。

该框架是第一个实时基于区域的文本到图像生成框架。通过稳定快速推理技术并重构模型为新提出的多提示流批处理架构,实现了比现有解决方案更快的全景图生成速度,并在单个RTX2080Ti GPU上实现了基于区域的文本到图像合成的1.57FPS生成速度。

该框架引入了几种关键技术。首先是Latent Pre-Averaging,在推理的每个步骤中,先对中间潜在表示进行平均,以适应快速推理算法。其次是Mask-Centering Bootstrapping,在生成过程的前几步中,将每个遮罩的中心点对齐到图像中心,以确保对象不会被遮罩边缘切断。再次是Quantized Masks,通过量化遮罩来控制提示遮罩的紧密度,从而在不同噪声水平下平滑地融合生成区域。

此外,StreamMultiDiffusion还引入了一个名为Semantic Palette的新概念,这是一种交互式图像生成范式,允许用户通过手绘区域和文本提示实时生成高质量图像。这种方法类似于使用画笔在画布上绘制,但使用的是文本提示和遮罩。例如,用户可以在红色区域生成人物,在耳朵和尾巴区域标记为狗,系统会根据涂抹的区域生成长着狗狗耳朵和尾巴的人物。

论文中的实验结果表明,StreamMultiDiffusion在全景图生成和基于区域的文本到图像合成方面,相比于现有的MultiDiffusion方法,实现了显著的速度提升,同时保持了图像质量。这证明了该系统在实际应用中的巨大潜力和价值。

举报

  • 相关推荐
  • 卢伟冰:小米15 Ultra发布后 友商不能再叫Ultra

    今晚,小米发布会正式开始,小米15Ultra率先登场。在介绍小米15Ultra影像时,小米集团卢伟冰表示,小米15Ultra立项之初,他对工程师团队的要求是小米15Ultra发布之后,友商Ultra都不能再被称之为Ultra,表明小米15Ultra的影像达到了行业巅峰。2亿像素徕卡超广角型号是三星HP9,拥有1/1.4英寸主摄级大底,光圈是f/2.6,支持4.3X潜望式长焦,配备6P镜头。

  • 影像无敌!卢伟冰:小米15 Ultra发布后 友商不能再叫Ultra

    今日晚间,卢伟冰开启小米15Ultra爆料直播。卢伟冰在直播间表示,小米15Ultra立项之初,他对工程师团队的要求是,小米15Ultra发布之后,友商Ultra都不能再被称之为Ultra,暗示小米15Ultra的影像达到了行业巅峰。新品将在本月底发布。

  • 最美Ultra!OPPO Find X8 Ultra三月发

    OPPO周意保与网友互动时表示,OPPOFindX8Ultra是最美Ultra。根据曝光的信息,OPPOFindX8Ultra最大变化是采用2K直屏形态,这是FindX系列第一款直屏超大杯机型。新品将在3月份正式发布。

  • 魏思琪晒小米15 Ultra首张自拍照 网友:自拍也Ultra

    今天,小米集团魏思琪晒出了小米15Ultra首张自拍照,评论区有网友表示自拍也Ultra”。根据照片信息,小米15Ultra自拍照的分辨率为48967152,约为3500万像素,焦距为26mm,光圈为f/2.0,从自拍照片可以看到,小米15Ultra自拍画面清晰,五官轮廓立体,皮肤细腻,肤色自然,发丝表现更是丝丝分明。该机将在下周正式发布。

  • 最新Mac Studio用的还是上代M3 Ultra:苹果给出解释

    今天苹果更新了MacStudio,但其高端型号搭载的仍是上一代的M3Ultra芯片非最新的M4Ultra,这也引发了不少猜测。对此苹果向ArsTechnica解释称:并不是每一代Mac的M系列芯片都会包含Ultra版本”。M3Ultra还支持120Gbps的雷电5接口,并可扩展至512GB内存。

  • 微软发布创新大模型:一张图片就能生成游戏,游戏界ChatGPT来了

    微软在官网发布了专用于游戏领域的创新大模型——Muse。虽然Muse基于Transformer架构,但创建游戏场景的方式却非常独特,并不依赖传统的文本提示是通过游戏画面和控制器操作的序列化数据作为输入提示,从生成连贯的游戏场景和玩法,同时更符合游戏机制和物理规则的游戏内容。Muse模型可以在微软的AzureAIFoundry上体验。

  • 美女产品经理打造OPPO Find X8 Ultra:最美Ultra

    周意保介绍,OPPOFindX8Ultra产品经理名叫姜雨晴,她和团队打造出了最美Ultra。根据数码闲聊站爆料的信息,OPPOFindX8Ultra的看点包括2K极窄四等边直屏、3D单点超声波指纹、3X6X大光圈双潜望镜、超级蓝玻璃物理长焦微距、100W有线充6000mAh双芯电池、8.xxmm无素皮机身IP68/690916定制马达。周意保还暗示,OPPOFindX8Ultra将会带来全新的粉色,颜值很高,该机将于4月份正式发布。

  • OPPO Find X8 Ultra预热 周意保:最强影像 最美Ultra

    OPPO周意保开始预热OPPOFindX8Ultra,他表示,OPPOFindX8Ultra产品亮点实在太多了,如果只用三句话来介绍这个产品,我用会这三句话。1、最强影像,拍人更美;2、最美Ultra,唯一直屏,极窄黑边。该机将在4月份正式发布,与OPPOFindX8Next同台亮相。

  • 经销商看到OPPO Find X8 Ultra真机后激动不已:直呼最美Ultra

    OPPO周意保介绍,今天是OPPOFindX8Ultra和全国OPPO代理商伙伴们见面的日子,大家看到真机后都激动不已,都说是最好看的Ultra、最美Ultra。OPPOFindX8Ultra和其它国产Ultra机型的区别在于,前者采用2K直屏,并且是四边等窄设计,机身厚度不到9mm,是同期最轻薄的Ultra机型。核心配置上,OPPOFindX8Ultra采用2K直屏,搭载高通骁龙8至尊版移动平台,支持100W有线闪充,支持卫星通信,新品会在4月份正式发布。

  • 能和小米SU7 Ultra硬碰硬吗 小鹏P7 Ultra商标信息曝光

    近日,国内车圈最火车型非小米SU7Ultra莫属。全车1548匹马力,起售价仅为52.99万元,相较预售价降了近30万元,给了预定车主一个天大的惊喜,发售后订单更是远超小米预期。P7Ultra敢在弯道上与保时捷比速度,可以猜测,P7Ultra的动力性能和操控都相当不俗,甚至也会用上三电机,动力突破千匹,与小米SU7来波硬碰硬。

热文