首页 > 业界 > 关键词  > MoA最新资讯  > 正文

MoA:用于图片合成的混合注意力架构 可实现风格参考和人物融合

2024-04-22 09:36 · 稿源:站长之家

划重点:

🔍 引入了一种新的架构,名为注意力混合模式(MoA),用于个性化文本到图像扩散模型。

🎨 MoA 通过将生成工作负载分配给两个注意力路径来实现给定主题和背景的分离生成。

🖼 MoA 能够生成高质量、个性化的图像,使得主题和背景的控制更加分离。

站长之家(ChinaZ.com)4月22日 消息:最新的研究中,提出了一种名为注意力混合模式(MoA)的新架构,旨在个性化文本到图像扩散模型,可以实现风格参考和人物融合的效果。

受大型语言模型(LLMs)中使用的专家混合机制的启发,MoA 通过将生成工作负载分配给两个注意力路径来实现给定主题和背景的分离生成。具体来说,MoA 保留了原始模型的先验知识,通过固定先验分支中的注意力层,同时通过个性化分支最小干预生成过程,学习将主题嵌入由先验分支生成的布局和背景中。

image.png

一种新颖的路由机制管理着每个层中像素在这些分支之间的分布,以优化个性化和通用内容创建的混合。经过训练,MoA 能够轻松生成高质量的个性化图像,其主题和背景的组合和交互与原始模型生成的一样丰富多样。最重要的是,MoA 增强了模型的现有能力与新增个性化干预之间的区别,从而提供了一种之前无法实现的更为分离的主题 - 背景控制。

此外,研究还探讨了 MoA 在现实应用中的潜力。例如,结合 MoA 和 DDIM 反演技术,可以实现对真实图像中主体的替换;结合 MoA 和 ControlNet,可以实现带有姿势控制的个性化生成;MoA 甚至能够在面部和身体形状完全不同的情况下进行主体交换,以及轻松地在主体之间进行形态变换。这些应用展示了 MoA 在个性化图像生成领域的潜在价值和广泛适用性。

image.png

image.png

产品入口:https://top.aibase.com/tool/mixture-of-attention-moa-

举报

  • 相关推荐
  • 思看科技联合浙江大学机械工程学院产教融合研讨会顺利举行

    2025年6月6日,思看科技与浙江大学机械工程学院联合举办第二届"智能制造创新人才培养与三维视觉技术产教融合研讨会"。会议汇聚学界和产业界专家,围绕智能制造人才培养策略与三维视觉数字化技术应用展开深入探讨。浙大机械工程学院党委书记刘振宇强调智能测量是智能制造基础,思看科技董事长江峰回顾校企合作成果。会议通过"上午实践展示+下午理论探讨"的创新模式,推动产教深度融合。与会专家就三维视觉技术在工业设计、质量检测等领域的创新应用进行交流,为智能制造人才培养提供新思路。活动搭建了"产学研用"高端对话平台,为产业变革注入创新动能。

  • 微美全息(WIMI.US)研究量子扩张卷积神经网络架构,开启量子与AI融合新篇章

    微美全息(WIMI.US)正探索量子扩张卷积神经网络(QDCNN)技术,将量子计算优势融入传统CNN架构。该技术通过量子比特的叠加态特性,能同时处理多维度数据,突破传统CNN在处理复杂数据时的局限。QDCNN不仅能获取传统CNN的特征,还能挖掘数据中隐藏的量子级特征信息。微美全息通过优化量子与经典计算的任务调度机制,让量子处理器专注加速效果显著的部分。未来将通过分布式量子计算技术提升系统可扩展性,适应大规模数据处理需求。这一创新有望在图像识别、智能预测等领域带来技术飞跃。

  • 《卓世科技MCP 技术融合实践白皮书》发布

    本文介绍了AI应用开发中MCP(模型上下文协议)的重要作用。MCP作为标准化AI工具交互协议,允许AI代理根据任务上下文自主发现、选择和编排工具,突破传统预定义工具映射的局限。文章重点展示了卓世科技在医疗健康领域的创新实践:通过MCP整合多源异构医疗知识图谱,构建全栈式健康监测网络,实现诊疗规范、药品信息等动态同步;同时开发智能周报系统,实现多模态内容自动生成与精准推送。MCP架构采用客户端-服务器模式,支持本地高效通信与云端实时交互,为AI应用提供灵活性和互操作性。未来,MCP将与A2A协议互补协作,推动AI从单点工具向系统化智能协同演进。

  • 男子意外钓到鳄鱼 多方合力妥善安置:正在调查来源

    ​近日,浙江宁波发生一起令人意外的事件。李先生在一条小溪内进行钓鱼活动时,收线过程中察觉到鱼线另一端挣扎异常剧烈。待他将“猎物”拖出水面,竟发现是一条鳄鱼。 这条鳄鱼虽体型不算庞大,但性情极为凶猛,刚出水便张着大嘴试图攻击李先生,模样十分“暴躁”。突如其来的状况让李先生大吃一惊,一时之间不知所措,随后他迅速拨打了110报警电话。 野生动�

  • 月访问量超千万的AI图片产品,如何炼成

    作为与 AI 最容易产生化学反应的图片行业,在 AIGC 来临后最早起势,但同样面临竞争激烈、产品同质化等挑战,而在如今图片编辑细分方向几乎处于横盘的状态下,这类产品前路如何、团队如何维系用户基础、又怎样探索新的增长机会?在上个月的 GTC 全球流量大会上,我

  • 腾讯iOA EDR:全方位狙击银狐木马,破解“钓鱼+免杀”组合拳

    银狐木马(又称"游蛇")是近年来活跃在亚太地区的高级恶意程序,主要针对政府、金融、医疗及制造业的高价值岗位人员。其攻击手段包括:1)精准钓鱼攻击,伪造税务通知、财政补贴等官方文件;2)通过社交平台、云存储等多渠道传播;3)采用多阶段内存加载、驱动级对抗等技术规避检测;4)形成"传播-驻留-窃密"完整攻击链。最新变种已迭代至第四代,能长期潜伏并窃取数据。腾讯iOA团队通过内核级探针技术,在实战中成功拦截某游戏公司遭受的攻击,完整溯源了从钓鱼文件下载到C2通信的全过程。建议用户提高警惕,及时部署终端安全软件,中小企业可免费使用腾讯iOA基础版防护。

  • 纳米 AI 融合仓颉登陆鸿蒙,为国产AI搜索筑牢自主根基

    近日,纳米 AI 搜索与华为达成重磅合作,纳米AI的移动App正式入驻鸿蒙 HarmonyOS5 生态,实现移动端与桌面端设备的全场景流畅运行。

  • 即梦图片3.0又重磅更新,这可能是对普通人最有用的一次。

    MD,这次连设计师的参考图也一键干碎了。。。 我测了整整一夜,现在是凌晨4点21,我还在写这篇文章。 我人真的傻了,我真的不愿意用一些什么很夸张的词语,但是即梦的绘图,每一次,带给我的震撼,都会觉得,我这么多年的设计师生涯,在AI的进化速度面前,不值一提。 什么样的言语,都无法比拟直接看图来的直接,直接给你们看效果。 这是一张,很好看的北京的�

  • 解码张家港鲲之益:AI 数字直播基地如何领跑长三角数实融合赛道?

    张家港市乐余镇与上海鳐之益科技合作打造长三角首个AI数字直播基地,以"AI新质生产力赋能实体经济"为核心,构建集技术研发、场景应用、产业孵化于一体的全栈式生态。该基地仅用6个月建成2000㎡运营空间,具备数字人克隆、智能对话系统等12项专利技术,覆盖政务、农业、工业等多领域定制化AI工具。通过50+智能直播间和产业大数据平台,助力企业降本增效,并联�