首页 > AI头条  > 正文

线稿上色的新技术​MangaNinja:输入线稿和参考图,精准给线稿上色

2025-01-16 09:18 · 来源: AIbase基地

近日,一项名为 MangaNinja 的线稿上色方法引起了广泛关注,只需输入线稿和参考图,就能依据参考图给目标线稿上色。这项技术基于扩散模型,专注于参考图像引导的线稿上色,极大地提升了上色的精准度和互动控制能力。

研究团队通过两项创新设计,确保了角色细节的精确传递。首先,他们引入了一个补丁重排模块,以促进参考彩色图像与目标线稿之间的对应学习。其次,采用了点驱动的控制方案,使得用户可以对颜色进行精细匹配。

image.png

在他们的实验中,研究人员构建了一个自收集的基准数据集,并与现有的上色方法进行了比较,结果表明 MangaNinja 在上色准确性和生成图像质量上显著优于其他方法。这种方法的一个重要特点是,它能够在生成结果中不依赖于点的引导,依然实现高质量的上色效果。

image.png

MangaNinja 在处理一些具有挑战性的场景时显示了其独特的优势。比如,在面对角色姿势变化大或细节缺失的情况下,点引导能帮助解决这些问题。当涉及多个对象时,点引导还能够有效防止颜色混淆。此外,用户可以通过选择多个参考图像的特定区域来进行多参考图像的上色,从而为线稿的各个元素提供指导,并有效解决相似视觉元素之间的冲突。

该技术还支持在使用不同参考图像时,实现语义上的颜色匹配和精细控制。研究人员相信,这种互动式的上色方式能够帮助用户在上色过程中找到灵感,并提供更多的创作可能性。

项目:https://johanan528.github.io/MangaNinjia/

github:https://github.com/ali-vilab/MangaNinjia

划重点:

🌟 MangaNinja 是一种基于参考图像的线稿上色方法,具备精准匹配和细致控制的能力。  

🎨 通过创新的补丁重排模块和点驱动控制方案,MangaNinja 显著提升了上色的准确性与图像质量。  

🖌️ 该技术能够应对多样化的上色挑战,包括极端姿势和多参考图像的协调,实现高质量的互动上色体验。

  • 相关推荐
  • 小鹏汽车与华为达成合作 XHUD相关新技术将发布

    近日,小鹏汽车正式官宣与华为乾崑智能汽车解决方案达成合作。小鹏汽车方面表示,汽车行业许久未出现令人眼前一亮的变革,而此次合作将开启改变,让行业“看见未来”,并预告“明天见”,引发外界诸多期待。 从官方发布的预热海报中,能捕捉到不少关键信息。海报上出现了HUAWEI XHUD字样以及HUD画面,由此可推测小鹏汽车将采用华为提供的AR - HUD抬头显示技术。

  • REDMI K Pad杀到!首发多项新技术 4K内配置最豪华小平板

    今日,REDMI官宣旗下首款旗舰小平板REDMI K Pad。 小米中国区市场部总经理、REDMI品牌总经理王腾表示,REDMI K Pad全面超越iPad mini,做到4K以内配置最豪华的小平板”,推动安卓小平板全面进入旗舰时代。 据了解,REDMI K Pad采用LCD屏幕,与手机只需一颗DDIC驱动屏幕不同,K Pad为了让屏幕更清晰、采用超高分辨率,需要两颗IC来驱动屏幕。 王腾指出,双驱动IC的难度在于数据、亮度�

  • 国际先进!itc保伦股份这项新技术顺利通过中国电器工业协会科技成果鉴定

    5月27日,中国电器工业协会在ITC保伦股份组织召开了"智能超高清视讯系统关键技术研究与应用"项目科技成果鉴定会。该项目由广东保伦电子、华南理工大学等单位共同完成,经专家鉴定整体技术达到国际先进水平。项目攻克了多项关键技术:实现4K60帧超高清视频画质;开发抗30%网络丢包的视频传输技术;创新实时智能语音处理技术等。已获32件发明专利,参与制定2项团体标准。鉴定委员会一致认为项目成果可广泛应用于政府、企业等领域,将有力支持远程视频会议系统建设发展。ITC表示将持续推动国产音视频技术创新发展。

  • 绝非流量!雷军:小米汽车卖爆是核心技术突破及对用户需求精准把握

    流量是小米汽车卖爆的原因吗,显然不是,至少雷军不这么认为。 雷军昨天接受媒体采访时表示,究其原因小米汽车卖爆主要是他们在核心技术上的突破,更重要的是对用户需求的精准把握。 当然了,我国新能源车完备的产业链也是重要原因。 类似的话题之前雷军不止一次还表示,之前小米SU7交付超过25万台的关键时刻,雷军就曾直言,强大的产品力是高销量的基础,还有

  • 如何用 DeepSeek 为产品创作slogan

    本文介绍如何利用DeepSeek工具高效创作优质产品slogan。首先在DeepSeek官网注册登录,输入详细指令如"为小米SU7创作5条突出性能/情感/社会价值的slogan";获取初稿后,通过补充指令反复优化调整,直至获得满意的5条高质量slogan。该方法能精准传达产品核心价值,吸引消费者目光,让原本费脑的slogan创作变得轻松高效。

  • Manus与Lovart之后,又一颠覆B2B外贸行业的智能体来了!信风AI引智能化拓客浪潮

    我们见过太多传统的外贸获客方式:买一份客户数据、雇几个人做电话/邮件、甚至手动跑展会、查黄页、看海关单。但这些方法普遍存在两个问题——效率低、成本高。尤其是试图开拓新市场时,语言不通、信息不全、时间滞后,成了外贸人绕不开的难题。

  • AI日报:夸克发布首个高考志愿大模型;Trae月活跃用户破100万;Manus推出免费无限聊天模式

    【AI日报】今日AI领域热点速览: 1. 夸克APP推出高考志愿大模型,免费提供个性化填报指导 2. Manus AI开放免费无限聊天模式,挑战行业巨头 3. Trae开发者平台月活破百万,累计交付60亿行代码 4. 迪士尼环球起诉Midjourney侵犯影视版权 5. 维基百科暂停AI生成摘要实验 6. 360发布"纳米AI超级搜索智能体",内置80多款大模型 7. PartCrafter项目实现单张图片生成高精度3D模型 8. Meta推出AI视频编辑工具,支持50多种预设效果 9. 阿里工程师放弃春节假期全力追赶DeepSeek技术 10. 火山引擎发布PromptPilot智能提示优化平台 11. OpenAI洽谈400亿美元融资,拓展AI生态系统 12. 新一代o3-pro推理模型发布并调整API定价策略

  • 不再纠结志愿填报!夸克“模拟选志愿”服务上线 输入分数即可

    夸克APP上线高考志愿模拟填报功能,基于考生预估成绩和排名智能推荐院校专业组合。系统采用"冲稳保"梯度策略,自动计算志愿合理性,支持随时编辑分享方案。高考成绩公布后只需更新分数,系统将自动调整志愿数据。夸克连续7年免费提供该服务,依托覆盖2900多所高校、1600个专业及20多个行业就业数据的权威数据库,为考生提供科学填报建议。

  • 女子在动物园被大猩猩反向投喂:精准扔了一个果子

    ​6月3日,在长春一家动物园内发生了令人忍俊不禁的趣事。一名游客在参观时,突发奇想向园区内的大猩猩讨要沙果吃。 原本大家以为这不过是游客的一时玩闹,没想到大猩猩竟有了回应。只见这只大猩猩从远处精准地扔了一个果子过来,这一幕让周围游客纷纷侧目。

  • 从“烂脸急救”到“抗炎养成”:杜莎之谜去红瓶带来精准改善炎症方法

    文章指出抗泛红护肤需要科学方法而非简单使用网红产品。杜莎之谜品牌建议:1.保持温和清洁习惯,使用氨基酸洁面乳;2.做好"硬防晒+化学防晒"双重防护;3.普通抗红产品只能暂时缓解,建议配合微针疗法;4.推荐使用其去红瓶产品,含超微渗透工艺的抗炎修复成分,能快速抑制炎症并修复细胞。强调抗炎需要"预防-抗炎-修护-巩固"完整闭环,该产品作为核心武器可帮助实现从"烂脸急救"到"健康美肌"的蜕变。

今日大家都在搜的词: