首页 > 业界 > 关键词  > MoA最新资讯  > 正文

MoA:用于图片合成的混合注意力架构 可实现风格参考和人物融合

2024-04-22 09:36 · 稿源:站长之家

划重点:

🔍 引入了一种新的架构,名为注意力混合模式(MoA),用于个性化文本到图像扩散模型。

🎨 MoA 通过将生成工作负载分配给两个注意力路径来实现给定主题和背景的分离生成。

🖼 MoA 能够生成高质量、个性化的图像,使得主题和背景的控制更加分离。

站长之家(ChinaZ.com)4月22日 消息:最新的研究中,提出了一种名为注意力混合模式(MoA)的新架构,旨在个性化文本到图像扩散模型,可以实现风格参考和人物融合的效果。

受大型语言模型(LLMs)中使用的专家混合机制的启发,MoA 通过将生成工作负载分配给两个注意力路径来实现给定主题和背景的分离生成。具体来说,MoA 保留了原始模型的先验知识,通过固定先验分支中的注意力层,同时通过个性化分支最小干预生成过程,学习将主题嵌入由先验分支生成的布局和背景中。

image.png

一种新颖的路由机制管理着每个层中像素在这些分支之间的分布,以优化个性化和通用内容创建的混合。经过训练,MoA 能够轻松生成高质量的个性化图像,其主题和背景的组合和交互与原始模型生成的一样丰富多样。最重要的是,MoA 增强了模型的现有能力与新增个性化干预之间的区别,从而提供了一种之前无法实现的更为分离的主题 - 背景控制。

此外,研究还探讨了 MoA 在现实应用中的潜力。例如,结合 MoA 和 DDIM 反演技术,可以实现对真实图像中主体的替换;结合 MoA 和 ControlNet,可以实现带有姿势控制的个性化生成;MoA 甚至能够在面部和身体形状完全不同的情况下进行主体交换,以及轻松地在主体之间进行形态变换。这些应用展示了 MoA 在个性化图像生成领域的潜在价值和广泛适用性。

image.png

image.png

产品入口:https://top.aibase.com/tool/mixture-of-attention-moa-

举报

  • 相关推荐
  • 表情包自由!腾讯搜狗输入法联合腾讯混元 推出AI表情合成

    不用再为微信、QQ回消息而烦恼,目前毫秒级AI生成表情包已经实现。 近日,搜狗输入法版推出AI合成表情”和候选表情”两大功能,用AI技术提升用户社交沟通体验。 其中,AI合成表情”基于腾讯混元大模型技术,用户输入文字描述或表情描述,便可毫秒级生成个性化表情包。 候选表情”则是用户在输入常用文字时,候选区自动推荐高匹配度表情包,一键即可发送,告别手�

  • 思看科技联合浙江大学机械工程学院产教融合研讨会顺利举行

    2025年6月6日,思看科技与浙江大学机械工程学院联合举办第二届"智能制造创新人才培养与三维视觉技术产教融合研讨会"。会议汇聚学界和产业界专家,围绕智能制造人才培养策略与三维视觉数字化技术应用展开深入探讨。浙大机械工程学院党委书记刘振宇强调智能测量是智能制造基础,思看科技董事长江峰回顾校企合作成果。会议通过"上午实践展示+下午理论探讨"的创新模式,推动产教深度融合。与会专家就三维视觉技术在工业设计、质量检测等领域的创新应用进行交流,为智能制造人才培养提供新思路。活动搭建了"产学研用"高端对话平台,为产业变革注入创新动能。

  • AI日报:阿里通义推Qwen-TTS模型;Cursor已支持网页和手机端;字节发布图像合成技术XVerse

    【AI日报】今日AI领域7大突破:1)阿里通义Qwen-TTS实现方言语音合成重大突破;2)Cursor发布Web版AI编程工具;3)字节XVerse技术实现多对象精准图像生成;4)NoteGen跨平台AI笔记工具革新知识管理;5)ManimML动画库可视化Transformer架构;6)TEN+Agent开源语音交互技术降低延迟;7)Chai-2抗体设计模型将药物研发周期缩短至两周。淘宝同时上线RecGPT推荐模型提升购物体验。

  • 三星艺术电视开启空间、时间与情感融合新篇

    在消费审美升级的当下,以前“能用”的冰冷家电逐渐蜕变为可以让用户“臻享”美好生活的具象化载体。《2025中国家电消费者利益洞察白皮书》指出,现代家电需化身“空间场景设计师”、“生活时间规划师”与“情感价值连接者”,从而满足用户日益多样化、个性化的需求。连续19年领跑全球电视市场的三星,今年将艺术电视矩阵焕新升级,将Lifestyle 艺术系列的灵感内核�

  • 男子意外钓到鳄鱼 多方合力妥善安置:正在调查来源

    ​近日,浙江宁波发生一起令人意外的事件。李先生在一条小溪内进行钓鱼活动时,收线过程中察觉到鱼线另一端挣扎异常剧烈。待他将“猎物”拖出水面,竟发现是一条鳄鱼。 这条鳄鱼虽体型不算庞大,但性情极为凶猛,刚出水便张着大嘴试图攻击李先生,模样十分“暴躁”。突如其来的状况让李先生大吃一惊,一时之间不知所措,随后他迅速拨打了110报警电话。 野生动�

  • 腾讯iOA EDR:全方位狙击银狐木马,破解“钓鱼+免杀”组合拳

    银狐木马(又称"游蛇")是近年来活跃在亚太地区的高级恶意程序,主要针对政府、金融、医疗及制造业的高价值岗位人员。其攻击手段包括:1)精准钓鱼攻击,伪造税务通知、财政补贴等官方文件;2)通过社交平台、云存储等多渠道传播;3)采用多阶段内存加载、驱动级对抗等技术规避检测;4)形成"传播-驻留-窃密"完整攻击链。最新变种已迭代至第四代,�

  • 双星合力突破天外天!996传奇盒子“鹰羽合击”感受鹰击长空的畅快

    《鹰羽合击》是一款基于1.85经典三职业版本的传奇手游,主打双英雄合击玩法。游戏通过1+1>2的合击技能机制,让战士、法师、道士三大职业组合产生强力连携效果,如双战士的高爆发、战法组合的均衡发展等。游戏在经典盟重省地图基础上,新增"鹰羽之城"大陆,包含帝王陵墓、异界空间等十余个全新副本。装备系统包含上千件装备,通过刷怪、锻造等方式获取,并设有盾牌、时装、神兵等进阶系统。游戏提供双角色培养体系,70级后开启四格觉醒、不灭心魔等深度玩法。每日任务、免费会员福利等机制帮助玩家轻松成长。玩家可通过996传奇盒子下载,享受云挂机等便捷功能。

  • 纳米 AI 融合仓颉登陆鸿蒙,为国产AI搜索筑牢自主根基

    近日,纳米 AI 搜索与华为达成重磅合作,纳米AI的移动App正式入驻鸿蒙 HarmonyOS5 生态,实现移动端与桌面端设备的全场景流畅运行。

  • 即梦图片3.0又重磅更新,这可能是对普通人最有用的一次。

    MD,这次连设计师的参考图也一键干碎了。。。 我测了整整一夜,现在是凌晨4点21,我还在写这篇文章。 我人真的傻了,我真的不愿意用一些什么很夸张的词语,但是即梦的绘图,每一次,带给我的震撼,都会觉得,我这么多年的设计师生涯,在AI的进化速度面前,不值一提。 什么样的言语,都无法比拟直接看图来的直接,直接给你们看效果。 这是一张,很好看的北京的�

  • 解码张家港鲲之益:AI 数字直播基地如何领跑长三角数实融合赛道?

    张家港市乐余镇与上海鳐之益科技合作打造长三角首个AI数字直播基地,以"AI新质生产力赋能实体经济"为核心,构建集技术研发、场景应用、产业孵化于一体的全栈式生态。该基地仅用6个月建成2000㎡运营空间,具备数字人克隆、智能对话系统等12项专利技术,覆盖政务、农业、工业等多领域定制化AI工具。通过50+智能直播间和产业大数据平台,助力企业降本增效,并联�