MoA：用于图片合成的混合注意力架构可实现风格参考和人物融合

2024-04-22 09:36 · 稿源：站长之家

划重点:
🔍 引入了一种新的架构，名为注意力混合模式（MoA），用于个性化文本到图像扩散模型。
🎨 MoA 通过将生成工作负载分配给两个注意力路径来实现给定主题和背景的分离生成。
🖼 MoA 能够生成高质量、个性化的图像，使得主题和背景的控制更加分离。

站长之家（ChinaZ.com）4月22日消息:在最新的研究中，提出了一种名为注意力混合模式（MoA）的新架构，旨在个性化文本到图像扩散模型，可以实现风格参考和人物融合的效果。

受大型语言模型（LLMs）中使用的专家混合机制的启发，MoA 通过将生成工作负载分配给两个注意力路径来实现给定主题和背景的分离生成。具体来说，MoA 保留了原始模型的先验知识，通过固定先验分支中的注意力层，同时通过个性化分支最小干预生成过程，学习将主题嵌入由先验分支生成的布局和背景中。

一种新颖的路由机制管理着每个层中像素在这些分支之间的分布，以优化个性化和通用内容创建的混合。经过训练，MoA 能够轻松生成高质量的个性化图像，其主题和背景的组合和交互与原始模型生成的一样丰富多样。最重要的是，MoA 增强了模型的现有能力与新增个性化干预之间的区别，从而提供了一种之前无法实现的更为分离的主题 - 背景控制。

此外，研究还探讨了 MoA 在现实应用中的潜力。例如，结合 MoA 和 DDIM 反演技术，可以实现对真实图像中主体的替换;结合 MoA 和 ControlNet，可以实现带有姿势控制的个性化生成;MoA 甚至能够在面部和身体形状完全不同的情况下进行主体交换，以及轻松地在主体之间进行形态变换。这些应用展示了 MoA 在个性化图像生成领域的潜在价值和广泛适用性。

产品入口:https://top.aibase.com/tool/mixture-of-attention-moa-

（举报）

相关推荐

关键词：

MoA
AI头条

特斯拉新一代Roadster年内亮相马斯克曾称零百加速不到1秒

特斯拉首席设计师弗朗茨冯霍尔茨豪森近日在一档播客节目中明确表示，新一代特斯拉Roadster将按计划于今年亮相，研发进展顺利且已接近完成。作为特斯拉的最强性能版本车型，新一代Roadster的性能参数一直受到网友关注。特斯拉CEO马斯克此前曾披露，该车型设定了极为大胆的性能目

特斯拉 Roadster 性能参数
AI搜索优化工具推荐！如何用免费工具帮助内容在AI搜索中抢占排名

文章探讨AI搜索时代内容创作者面临的挑战与机遇。传统SEO优化在AI搜索中失效，2024年数据显示AI搜索流量激增350%。核心解决方案是GEO（生成式引擎优化），需关注内容权威性、结构清晰度和信息完整性。推荐免费工具AIBase，可一键查询多平台AI搜索排名，并提供具体优化建议。配合AnswerThePublic挖掘用户问题，结合Google Search Console监测流量变化。通过实际案例展示，经过三周优�
荐AI日报：Hailuo 2.3发布；豆包AI编程史诗级升级；马斯克推出AI百科全书Grokipedia

本期AI日报聚焦多领域突破：海螺AI 2.3实现视频生成技术跃升，支持双模式免费试用；豆包AI编程工具实现零基础可视化开发；马斯克推出AI百科Grokipedia；Mistral发布企业级AI开发平台；Anthropic推出金融版Claude，显著提升分析师效率；Pinterest升级AI购物助手功能；英伟达推出全能模型OmniVinci刷新性能纪录；DeepSeek模型在港大美股交易竞赛中以10.61%年化回报率夺冠。

AI视频生成 Hailuo 2.3
人类的心声，被AI听见了

过去一年里，一个看似无意义的Labubu，成为了颇具情绪号召力的符号。这只表情夸张、眼神狡黠的小兽，从逼仄的盲盒一路爬上潮流顶峰。它既不代表功能，也不传达身份，却让无数年轻人愿意为之排队、抽签。而这，离不开更大的消费变迁。事后诸葛来看，Labubu的走红并非偶然，而是精准踩中了一个趋势——在这个时代，人们似乎越来越愿意为“情绪价值”付费。与此�

文章搜索核心标签情绪价值
优酷用AI解题，为多元营销场景提效

AI浪潮持续奔涌，正以前所未有的速度渗透营销领域的每一处脉络。从创意发想到投放优化，AI技术已从概念探索走向规模化落地，深度融入营销工作的日常场景。在这场深刻的变革中，技术所展现出的最硬核、最毋庸置疑的现实价值便是——提效，而这也精准命中了行业沉积已久的痛点。比如在内容生产环节，过去一条TVC广告从策划到上线往往需要数月;即便是轻量级的信�

AI营销创意发想投放优化
荐为什么飞书多维表格成为了品牌进入AI时代的理想切口

今年的双11已经进入正赛阶段，除了往年大家都会关心的优惠玩法、销量增长，AI在电商领域的大规模落地应用也成为一个焦点议题。一个最直观的感受是，电商平台在这个双11开始大规模地推介自家的AI购物功能，向消费者展示更具创新性的购物体验，给到他们尝鲜机会。有用户和朋友体验过之后，在网上给出了「有用」的评价。虽然普及度依然有限，但AI导购走向大众已经�

AI购物双11 电商平台
AI搜索正在“偷走”你的客户,企业主必须立即关注GEO排名

随着AI搜索用户激增（ChatGPT月活38亿、DeepSeek 27.7亿），传统搜索引擎流量下滑。企业主发现：用户直接询问AI"推荐保洁设备"，结果前三位全是竞品，自身品牌未上榜。这揭示新战场——GEO（生成式引擎优化），核心是让AI在回答时主动推荐你的品牌。与SEO不同，GEO需通过专业内容建立权威性，包括完善官网信息、制作FAQ、发布深度文章。测试显示70%企业未被AI推荐，而�
企业主必须知道的AI搜索排名GEO信息

文章指出AI搜索正颠覆传统流量格局：2024年超58%的谷歌搜索变为"零点击"，用户直接从AI生成答案获取信息。ChatGPT月活用户超4亿，企业若未出现在AI答案中将彻底失去曝光。生成式引擎优化(GEO)成为新刚需——通过提升内容权威性、结构化数据和引用质量，使品牌被AI推荐。研究显示，实施GEO的企业AI流量增长800%，财富500强公司在6周内通过GEO获得32%销售线索。企业需转变思维：从追求搜索排名转向提升AI答案出现频率和推荐强度，在现有SEO基础上增加"AI可读性"层。
荐AI创作平台酣战，受伤的却是真人创作者？

国内的AI创作平台又添一名猛将:阿里巴巴AI旗舰应用夸克近日发布全新AI创作平台“造点”。平台集成AI生图与AI生视频两项核心能力，率先接入通义万相Wan2.5，成为国内最先支持音画同步视频生成的平台之一。至此，从腾讯的元宝、字节的豆包和即梦，到快手的可灵，再到如今的造点，AI创作已然成为未来的一大趋势，而平台之间的酣战也愈演愈烈。与此同时，内容创作者却

AI创作平台夸克造点音画同步视频生成
从游戏出海到AI应用出海世纪华通建树海外AI市场

世纪华通凭借成熟产品矩阵与全球化运营能力，成为中国游戏企业出海标杆。随着国内AI技术突破，公司加速拓展全球化赛道，推动AI应用落地海外市场。旗下极测信息与日本信华信合作，将核心产品“AI自主检测系统”引入日本自动化测试市场。该系统突破传统工具局限，实现测试用例自动生成与智能优化，效率提升超50%，已获行业权威认可。此次合作印证中国AI技术在垂直领域的全球价值，并凸显公司“ALL IN AI”战略——通过多元化产品覆盖产业需求，让AI成为全球化竞争核心势能。

游戏产业全球化运营 AI技术

今日大家都在搜的词：

热文

3 天
7天

MoA：用于图片合成的混合注意力架构可实现风格参考和人物融合

特斯拉新一代Roadster年内亮相马斯克曾称零百加速不到1秒

AI搜索优化工具推荐！如何用免费工具帮助内容在AI搜索中抢占排名

荐AI日报：Hailuo 2.3发布；豆包AI编程史诗级升级；马斯克推出AI百科全书Grokipedia

人类的心声，被AI听见了

优酷用AI解题，为多元营销场景提效

荐为什么飞书多维表格成为了品牌进入AI时代的理想切口

AI搜索正在“偷走”你的客户,企业主必须立即关注GEO排名

企业主必须知道的AI搜索排名GEO信息

荐AI创作平台酣战，受伤的却是真人创作者？

从游戏出海到AI应用出海世纪华通建树海外AI市场

今日大家都在搜的词：

热文

一加15今晚发布定位全能水桶机

AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度

红米REDMI K90全方位提升雷军：是不是越来越有旗舰气质

余承东曝鸿蒙智行新款享界S9将于11月上市

iPhone18发布或推迟苹果明年9月只发Pro系列和Fold折叠屏

华为MatePad Pro流金典藏版开卖：售价7799元

华为余承东：鸿蒙智行全系交付突破100万台仅用43个月

AI日报：Hailuo 2.3发布；豆包AI编程史诗级升级；马斯克推出AI

一加Ace 6开启预售：售价2599元起

华为MatePad Mini典藏版今日开售：售价5999元起

华为nova Flip S小折叠开售：首发3388元起

雷军回应K90定价：最近内存涨价太多希望大家理解这份诚意

REDMI K90标准版12+512GB降价300元小米回应：可退差价

苹果首款2nm手机芯片上热搜 A20由iPhone 18系列首发

一加15今晚发布定位全能水桶机

AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度

红米REDMI K90全方位提升雷军：是不是越来越有旗舰气质

小米汽车发布跨年购置税补贴方案至高不超15000元

余承东曝鸿蒙智行新款享界S9将于11月上市

iPhone18发布或推迟苹果明年9月只发Pro系列和Fold折叠屏

站长商机

MoA：用于图片合成的混合注意力架构 可实现风格参考和人物融合

今日大家都在搜的词：

热文

站长商机

MoA：用于图片合成的混合注意力架构可实现风格参考和人物融合