首页 > 业界 > 关键词  > OMG最新资讯  > 正文

腾讯推加强版InstantID项目OMG:让ID身份保持从一人变多人

2024-03-19 16:25 · 稿源:站长之家

站长之家(ChinaZ.com)3月19日 消息:腾讯近日推出了一项名为OMG的新研究,这项研究支持在一张图片中生成多角色多概念。这是一个突破性的进展,因为以前的ID或概念保持项目只能将一个人还原在图片里面,而有了这个项目以后,就可以实现多人合照了。

image.png

项目地址:https://top.aibase.com/tool/omg

该项目还支持与原有的ID保持项目一起使用,比如Lora以及InstantID。这意味着,用户可以在一个项目中同时使用多个模型,无需进行额外的调整。这对于需要处理大量图像的研究人员和开发者来说,无疑是一个巨大的便利。

OMG的代码已经开源,这意味着所有的开发者都可以查看其插件实现。这无疑将进一步推动该领域的研究和发展。

OMG是一个为个性化生成设计的框架,它能友好地处理遮挡问题,能在一幅图像中无缝集成多种概念。这个框架包含两个阶段:第一阶段专注于图像布局的生成和为处理遮挡而收集视觉理解信息;第二阶段则利用这些视觉理解信息,并结合精心设计的噪声混合技术,将多个概念融合在一起,同时考虑遮挡因素。

在噪声混合过程中,选择合适的开始去噪时间点对于保持人物身份和图像布局至关重要。这一点的发现,无疑将为未来的研究提供重要的参考。

此外,OMG还能与多种单概念生成模型兼容,如LoRA和InstantID。尤其值得一提的是,LoRA模型可以直接从这个网址获取并使用。这无疑将进一步推动该领域的研究和发展。

总的来说,腾讯的这项新研究,不仅为我们提供了一个全新的视角来处理图像生成问题,也为未来的研究提供了重要的参考。我们期待看到更多的研究成果在这个领域出现。

举报

  • 相关推荐
  • AI最新资讯在哪里看?AIbase:高效获取国内外AI新闻头条与行业动态

    文章探讨了AI时代信息过载的困境:有价值的前沿动态、重磅模型发布和行业解读分散各处,筛选成本高、效率低下。AIbase资讯导航站应运而生,通过四大核心功能解决痛点:1)聚合主流信源,过滤低质噪音;2)结构化分类呈现大模型动态、行业应用等六大板块;3)提炼核心要点,拒绝标题党;4)高频更新确保信息鲜度。该平台致力于成为AI领域的"信息雷达",帮助用户节省70%信息搜集时间,将精力聚焦于思考与创造。适用于技术负责人快速掌握行业动态、产品经理调研案例、投资人捕捉趋势等多元场景。

  • 央视网首场AI晚会七夕“AI心动夜”即将开启 联合可灵AI打造视听盛宴

    8月28日晚8点,央视频与快手可灵AI联合打造的七夕晚会“AI心动夜”正式开启。晚会以“AI视频叙事+传统文化”为核心,通过AI技术融合文化传承、艺术创作与情感表达,呈现跨越虚拟与现实、科技与文化交融的七夕盛典。节目包括《星河告白》《千年婚服秀》等,展现不同时代的爱情故事与中华婚服之美,同时通过《与妻书》《许愿吧》等作品探讨革命年代的深情与当代浪漫。晚会将在央视频、快手等平台同步直播,带领观众体验科技与文化的精彩碰撞。

  • 5个月狂揽超800万粉丝,这家AI公司想打造“AI账号工厂”?

    ​AI距离替代真人又近了一步? 最近,“科技大司马”连续多次登上新榜视频号科技互联网月榜TOP5,成为今年上半年涨势最猛的科技类账号之一,仅在视频号就2个月涨粉超166万,数据最好的一条视频全网播放量超5000万。

  • AI学习路线图:用“每天五分钟”系统化构建你的AI入门知识库

    本文介绍了一种高效AI学习方法:通过每日投入5分钟,利用AIbase资讯平台系统学习。建议从建立AI认知框架开始,关注技术、应用、产业三个维度;每日浏览全球AI新闻速递积累术语;主动探索特定领域;定期回顾构建知识图谱。强调持续微学习的重要性,无需熬夜苦读,一年后即可建立系统的AI知识体系。

  • 可赞AI深度测评:这款AI办公助手,让我告别加班写报告!

    文章分享了一款名为“可赞AI”的办公工具,能高效处理文档写作、图表制作和会议纪要整理。通过实际测试,作者发现该工具可自动生成结构化摘要、可视化图表,并支持多场景适配,大幅提升办公效率。尤其适合团队协作,减少沟通成本。虽然部分复杂功能仍需优化,但整体完成度高,值得职场人士尝试。

  • 狂奔一年,AI玩具们找到了自己的路

    一年前,AI玩具还被怀疑是概念炒作,需要量产数据去证明这个需求真实存在。经过一年发展,这个市场快速膨胀变大,出现了更多样的产品路径、更大额度的融资和更多愿意为之买单的消费者。 「一年前产品刚推出的时候,我们特别忐忑。」跃然创新CEO李勇告诉我们,当时没有成熟的案例作为参照,不知道能不能卖好,团队只是凭直觉认为,将大模型对话能力和毛绒玩具结�

  • AI火花集|AI火花先锋添新力,拆解保险、客服、物联网AI落地实战

    AI正加速渗透产业,2025年全球AI投资预计达2000亿美元,年增长近翻倍。保险、电商客服、智能家居成为落地先锋。暖哇科技、云起未来、蜂助手分别聚焦保险理赔自动化、电商智能客服、5G+AI物联网,通过实战方案推动AI从概念验证走向规模化应用。面临数据价值陷阱、流通壁垒等挑战,企业需构建专业知识库并优化人机协同。未来AI将深入产业毛细血管,汇聚零散创新火花,�

  • 最新AI资讯哪里看?AI技术人员如何从论文到产业应用全覆盖?

    文章指出,ArXiv、ACL和NeurIPS等论文库是AI开发者获取前沿技术的重要来源,但仅依赖论文库已不足以构建完整竞争力。作者强调需要超越论文本身,关注技术落地、产业应用及生态动态。推荐利用AIbase等技术资讯平台作为补充,提供筛选整合、趋势解读和产业视角,帮助开发者高效把握技术动态,避免闭门造车,构建复合型信息摄入体系。

  • AI产品栏目推荐:2025年值得关注的全球AI创新动态与前沿工具盘点

    AIbase是一个全球AI创新观察平台,收录了来自100多个国家和地区的2万多个AI产品。它提供实时更新、全球热门排行和精细筛选功能,帮助用户发现全球最新AI趋势。平台不仅展示产品信息,还提供技术说明、定价等详细数据,支持中文呈现,降低信息获取门槛。对投资者、研究人员和产品经理等不同用户群体都具有重要价值,是连接全球AI创新脉搏的重要枢纽。

  • B站要变成AI站

    互联网平台都在跟AI结合,B站没有成为例外。从新一季度财报来看,B站的AI味儿也越来越浓了。 8月21日,B站公布第二季度业绩,总营收达73.4亿元人民币,同比增长20%。其中,游戏业务收入为16.1亿元,同比增长60%,广告业务收入为24.5亿元,同比增长20%。由此推动B站毛利率从去年同期的29.9%提升至36.5%,调整后净利润达到5.6亿元,创下历史最好成绩。 从整体来看,B站生态集聚

今日大家都在搜的词: