AI实时绘画系统StreamMultiDiffusion 支持局部涂抹+提示生成图片

2024-03-15 14:58 · 稿源：站长之家

站长之家（ChinaZ.com）3月15日消息:近期，一篇名为"StreamMultiDiffusion"的论文提出了一种新颖的实时、交互式的文本到图像生成系统。这种系统能够根据用户提供的手绘区域和相应的语义文本提示来生成图像，为专业图像创作者提供了一个强大的工具，可以用于快速原型设计和创意探索。

项目地址:https://github.com/ironjr/StreamMultiDiffusion

扩散模型在文本到图像合成领域取得了巨大成功，成为了图像生成和编辑的有前途的候选者。然而，将这些模型用于实际应用仍面临两大挑战:一是需要更快的推理速度，二是需要更智能的模型控制。这两个目标需要同时满足，才能在实际应用中发挥作用。为了解决这些挑战，作者提出了StreamMultiDiffusion框架。

该框架是第一个实时基于区域的文本到图像生成框架。通过稳定快速推理技术并重构模型为新提出的多提示流批处理架构，实现了比现有解决方案更快的全景图生成速度，并在单个RTX2080Ti GPU上实现了基于区域的文本到图像合成的1.57FPS生成速度。

该框架引入了几种关键技术。首先是Latent Pre-Averaging，在推理的每个步骤中，先对中间潜在表示进行平均，以适应快速推理算法。其次是Mask-Centering Bootstrapping，在生成过程的前几步中，将每个遮罩的中心点对齐到图像中心，以确保对象不会被遮罩边缘切断。再次是Quantized Masks，通过量化遮罩来控制提示遮罩的紧密度，从而在不同噪声水平下平滑地融合生成区域。

此外，StreamMultiDiffusion还引入了一个名为Semantic Palette的新概念，这是一种交互式图像生成范式，允许用户通过手绘区域和文本提示实时生成高质量图像。这种方法类似于使用画笔在画布上绘制，但使用的是文本提示和遮罩。例如，用户可以在红色区域生成人物，在耳朵和尾巴区域标记为狗，系统会根据涂抹的区域生成长着狗狗耳朵和尾巴的人物。

论文中的实验结果表明，StreamMultiDiffusion在全景图生成和基于区域的文本到图像合成方面，相比于现有的MultiDiffusion方法，实现了显著的速度提升，同时保持了图像质量。这证明了该系统在实际应用中的巨大潜力和价值。

（举报）

相关推荐

关键词：

数贸会今日开幕！每日互动展台人气火爆，GAI Station引领AI办公新体验

2025全球数字贸易博览会于9月25日在杭州开幕。每日互动公司（展位7A-T022）集中展示了AI产业实践与数据流通领域成果，重点推出10万元级智能工作站GAI+Station，集成写作、会议纪要、智能问答等功能，内置8大模型能力，破解成本与安全痛点。其“发数站”战略打通数据高效流通链路，已在医疗、交通等多领域落地，“数智绿波”应用覆盖全国30多个省市，通行效率提升20%以上。此外，AITA超级营销助手实现升级，机器狗互动表演吸引关注。展会期间将举办10余场专业发布，涵盖数据要素、大模型应用等行业实战，助力企业把握数字化机遇。

2025全球数字贸易博览会每日互动 AI产业实践
努比亚Z80 Ultra定档10月22日，能拍能打，街拍游戏机

努比亚Z80 Ultra将于10月22日发布，主打“能拍能打，绝世有双”定位，以“街拍游戏机”为核心标签。搭载三主摄方案，包括1/1.55大底广角、35mm高定主摄和85mm长焦，覆盖多场景拍摄。配备第五代骁龙8芯片和专业游戏引擎，支持144Hz刷新率、3000Hz触控采样率，游戏体验流畅。此外还具备超声波指纹、IP68/69防护、大容量电池等配置，实现影像与性能的全面升级，堪称全能旗舰机型。

努比亚Z80Ultra 街拍游戏机手机影像光学
全球唯一上榜扫地机！追觅 X50 Ultra 入选《时代》年度最佳发明

10月9日，《时代》周刊公布2025年度最佳发明榜单，追觅扫地机器人X50 Ultra凭借仿生机械足越障技术、自升降激光雷达及双机械臂贴边清洁等创新功能入选，成为唯一上榜的扫地机产品。该产品突破传统清洁局限，实现6厘米越障和毫米级无死角清洁，通过技术革新提升用户体验，体现品牌以创新解决用户痛点的战略方向。

追觅扫地机X50Ultra 仿生机械足技术年度最佳发明
努比亚Z80 Ultra官宣10月22日发布搭载无孔真全面屏

今日，努比亚官方正式宣布，全新旗舰机型Z80Ultra将于10月22日14时全球首发。这款新机最大亮点在于延续了品牌标志性的真全面屏设计，成为业内首款实现正面无任何开孔的智能手机，为用户带来完整的视觉沉浸体验。据官方公布的渲染图显示，Z80Ultra采用极窄边框工艺，上边框与左右两侧边框宽度控制极佳，黑边几乎不可见，仅下边框因技术限制稍宽。机身设计融入整体弧�

努比亚Z80Ultra 真全面屏骁龙8至尊版
首款骁龙8E5真全面屏！努比亚Z80 Ultra官宣

努比亚宣布将在本月推出年度旗舰努比亚Z80 Ultra。根据官方公布的海报，努比亚Z80 Ultra采用真全面屏形态，是行业首款第五代骁龙8至尊版全面屏旗舰。作为年度旗舰，努比亚Z80 Ultra不仅拥有真全面屏，影像也有大幅升级，该机采用罕见的三主摄方案，除了主摄和潜望长焦外还有一颗超大底超广角，传感器尺寸是1/1.55，拥有1m大像素，光圈还做到了f/1.8，边缘畸变控制会更好�

努比亚Z80 Ultra 第五代骁龙8至尊版
荐AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Coding大模型；苹果悄然研发ChatGPT式应用

快手发布KAT系列代码大模型，腾讯推出“混元图像3.0”实现多模态突破，苹果研发类ChatGPT应用升级Siri，谷歌更新Gemini 2.5 Flash Lite提升效率。苹果还推出Manzano图像模型，YouTube Music测试AI音乐主播功能，VideoFrom3D框架简化3D视频生成，Moondream 3.0在多项基准测试中超越GPT-5等顶尖模型，展现强大性能。

AI日报快手KAT系列大模型
小米史上最高端直板机！小米17 Ultra双卫星版入网：支持天通一号+北斗短报文

小米一款型号为25128PNA1C”的新机已经入网，这将是小米17 Ultra的双卫星版本，预计是最顶配，支持支持天通一号、北斗短报文，12月发布。另外，该机与此前入网的普通版一样，标配了UWB天线，之后可能会逐渐成为小米所有旗舰的标配，能够实现更方便精准的汽车解锁。

小米17 Ultra 双卫星版本
优惠500元！小米15 Ultra上市后首次调价卢伟冰：唯一的一皇一后组合

今日，小米手机宣布，小米15 Ultra即日起全版本特惠500元，到手价5999元起。据了解，小米15 Ultra全版本还可至高享12期免息或小米专属礼盒。小米集团总裁卢伟冰表示，小米15Ultra上市后首次调价，唯一的一皇一后组合，代号夜神！”

小米15 Ultra 手机优惠
小米17 Ultra四摄规格出炉：主摄告别索尼用上国产一英寸传感器

小米17系列已提前上市，国庆销量破百万。爆料显示，小米17 Ultra将元旦前发布，首次采用国产豪威科技1英寸主摄OV50X，配备四摄方案：5000万像素主摄、超广角、长焦及2亿像素潜望长焦。该主摄支持单次曝光HDR、四合一大像素及高帧率视频，可实现电影级拍摄。此外配备6.85英寸2K LTPO OLED窄边屏、骁龙8 Elite Gen5平台，支持无线快充与大容量电池。

小米17 小米17 Pro
小米15 Ultra官宣直降500元：售价5999元起

即日起小米15Ultra全版本特惠500元，到手价仅需5999元起，这一价格调整让这款旗舰机型性价比进一步提升。小米15Ultra于2025年2月份惊艳亮相，代号“夜神”，其影像实力堪称业界翘楚。该机搭载了史上最强悍的影像传感器，主摄采用1英寸光喻LYT-900超大底摄像头，光圈达f/1.63，拥有5000万像素的解析力，是目前业内公认的旗舰传感器，为拍摄提供了强大的硬件支持。不仅如此�

小米15Ultra 旗舰手机影像传感器

今日大家都在搜的词：

热文

3 天
7天

AI实时绘画系统StreamMultiDiffusion 支持局部涂抹+提示生成图片

数贸会今日开幕！每日互动展台人气火爆，GAI Station引领AI办公新体验

努比亚Z80 Ultra定档10月22日，能拍能打，街拍游戏机

全球唯一上榜扫地机！追觅 X50 Ultra 入选《时代》年度最佳发明

努比亚Z80 Ultra官宣10月22日发布搭载无孔真全面屏

首款骁龙8E5真全面屏！努比亚Z80 Ultra官宣

荐AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Coding大模型；苹果悄然研发ChatGPT式应用

小米史上最高端直板机！小米17 Ultra双卫星版入网：支持天通一号+北斗短报文

优惠500元！小米15 Ultra上市后首次调价卢伟冰：唯一的一皇一后组合

小米17 Ultra四摄规格出炉：主摄告别索尼用上国产一英寸传感器

小米15 Ultra官宣直降500元：售价5999元起

今日大家都在搜的词：

热文

AI日报：Veo 3.1可生成1分钟视频；蚂蚁发布万亿参数语言模型 L

京东双11今晚开启：现货开卖官方直降低至一折

三星W26折叠屏手机官宣10月11日发布

iQOO 15官宣：10月20日发布

影视飓风Tim送罗永浩顶配iPhone17ProMax 后者锐评：越做越难看

AI日报：美图RoboNeo上线首月MAU破百万；影视级音画同步模型Ga

新款智界R7/S7上市44天大定破38000台

荣耀Magic8系列暨MagicOS10发布会定档10月15日

11月开启！vivo OriginOS 6公测适配计划公布

iQOO 15搭载自研电竞芯片Q3 能效提升40%

微信又更新了撤回消息有大变化：可撤回本次发送的全部消息