首页 > 业界 > 关键词  > OMG最新资讯  > 正文

腾讯推加强版InstantID项目OMG:让ID身份保持从一人变多人

2024-03-19 16:25 · 稿源:站长之家

站长之家(ChinaZ.com)3月19日 消息:腾讯近日推出了一项名为OMG的新研究,这项研究支持在一张图片中生成多角色多概念。这是一个突破性的进展,因为以前的ID或概念保持项目只能将一个人还原在图片里面,而有了这个项目以后,就可以实现多人合照了。

image.png

项目地址:https://top.aibase.com/tool/omg

该项目还支持与原有的ID保持项目一起使用,比如Lora以及InstantID。这意味着,用户可以在一个项目中同时使用多个模型,无需进行额外的调整。这对于需要处理大量图像的研究人员和开发者来说,无疑是一个巨大的便利。

OMG的代码已经开源,这意味着所有的开发者都可以查看其插件实现。这无疑将进一步推动该领域的研究和发展。

OMG是一个为个性化生成设计的框架,它能友好地处理遮挡问题,能在一幅图像中无缝集成多种概念。这个框架包含两个阶段:第一阶段专注于图像布局的生成和为处理遮挡而收集视觉理解信息;第二阶段则利用这些视觉理解信息,并结合精心设计的噪声混合技术,将多个概念融合在一起,同时考虑遮挡因素。

在噪声混合过程中,选择合适的开始去噪时间点对于保持人物身份和图像布局至关重要。这一点的发现,无疑将为未来的研究提供重要的参考。

此外,OMG还能与多种单概念生成模型兼容,如LoRA和InstantID。尤其值得一提的是,LoRA模型可以直接从这个网址获取并使用。这无疑将进一步推动该领域的研究和发展。

总的来说,腾讯的这项新研究,不仅为我们提供了一个全新的视角来处理图像生成问题,也为未来的研究提供了重要的参考。我们期待看到更多的研究成果在这个领域出现。

举报

  • 相关推荐
  • AI不再健忘!红熊AI发布“记忆熊”,给大模型装上“海马体”

    当前大模型虽能力惊人,却普遍存在“记忆缺失”问题,制约了AI应用的深度与用户体验。红熊AI推出的开源记忆系统“记忆熊”,旨在突破这一瓶颈。它基于认知科学原理,构建了包含存储层、编排层和应用层的三层架构,模拟人类记忆的感知、提炼、关联与遗忘全周期,为智能体提供长期记忆框架。该系统不仅显著提升了任务性能与效率,降低了幻觉生成,更标志着AI设计从“即时响应”向“持续认知”的关键转变。记忆系统的完善,将驱动AI在医疗、教育、企业服务等领域实现更深度的智能化升级,开启人机协作的新时代。

  • 汉鑫科技与IBM落地“AI深耕计划”,赋能中国企业“AI+出海”

    山东汉鑫科技与IBM在烟台合作落地“AI深耕计划”,旨在为中国企业智能化转型和全球化运营提供安全、灵活、定制化的企业级技术方案和咨询服务。双方在四个月内完成从可行性评估到客户项目落地的全过程,并在2025年山东省绿色低碳高质量发展大会期间举行签约仪式。此前,双方已共同发布“HiMax+制造业AI+企业资产管理解决方案”,结合IBM Maximo平台和人工智能技术,以及汉鑫的行业经验,实现设备全生命周期管理、产品质量智能检测等复杂场景中的实时预警和预测性维护。未来,双方将聚焦企业智能化转型的全价值链打通,以“AI赋能+场景落地”的框架共创解决方案,助力烟台打造智能经济产业新生态,加速实现从“数字经济”到“智能经济”的跃迁。

  • 亿道信息以“AI+终端”与“AI+应用”双轮驱动,开启智能普惠新纪元

    12月3日,亿道信息在深圳举办年度“亿道科技日”,以“Edge+AI,端云协同”为核心,展示公司从产品提供商向场景计算体系构建者的战略转型。活动发布了覆盖个人、家庭、企业、工业、穿戴等核心场景的AI终端矩阵与一体化应用方案,致力于将AI转化为千行百业触手可及的生产力引擎。重点产品包括旗舰AI+PC(算力达180TOPS,预装“小亿AI助手”)、高性能AI+BOX(集成126TOPS算力与96GB显存)及全系列AI服务器矩阵。同时,公司推出“亿道超算AI智能引擎”以降低企业AI部署门槛,并展示AESOF跨平台开放框架,构建开放生态,与英特尔、高通等产业链伙伴深化合作,推动智能技术普惠化。

  • 什么是AI员工?雇佣AI员工后就可以替代人工吗?企业如何发挥AI员工的真正价值?

    本文探讨了AI员工如何从热门概念转变为驱动企业业务增长的核心引擎。文章指出,AI员工并非简单的聊天机器人,而是基于大模型技术、能理解任务并自主执行的智能体,其核心价值在于赋能人类员工、解放管理者精力。AI员工适合处理重复性高、操作繁琐的低价值工作,如客户服务、销售助理和售后支持等,从而让人类员工专注于更具创造性和战略性的任务。企业正确运用AI员工,不仅能提升效率和客户体验,还能构建更强大、高效的人机协同组织,激发增长潜力。

  • 携手共创AI新时代,安谋科技“AI Arm CHINA”战略驱动半导体生态重构

    2025年12月2日,SIIAS香港首届国际半导体峰会召开。安谋科技CEO陈锋发表主旨演讲,指出AI正从辅助工具演变为重塑行业生态的核心动力,推动半导体等产业系统性重构。公司确立“AI Arm CHINA”战略,旨在连接全球Arm生态与本土创新,并积极布局香港,构建产学研协同体系,以赋能中国AI产业发展。峰会展现了全球产业协作与生态融合的趋势,强调唯有携手共进,方能共赢智能未来。

  • 想让AI成为新引擎,快手不能只靠可灵

    从12月1日开始,快手开启了「可灵全能灵感周」,要连续5天,每天都发布一项新产品。目前,快手已经发布了统一多模态视频大模型可灵视频O1和全能图像模型可灵图片O1,展现了要一站式满足AI视频、图像创作需求的野心。 这种密集的发布,也是快手在向外界进一步展示自身的AI技术积累。而保持AI技术的领先是快手新故事的重要组成部分。从财报来看,快手已经把AI视作为�

  • 广告收入激增,B站尝到了AI的甜头?

    ​B站终于在商业化的长跑中尝到了甜头。 2025年Q3财报显示,B站总营收为76.9亿元人民币,同比增长5%;调整后净利润为7.9亿元,同比大幅增长233%,单季盈利创新高。 其中,广告业务实现23%的同比激增。但这,也将B站“社区初心与商业变现”的老难题推至新的风口浪尖。

  • “AI 教父”Hinton与云天励飞陈宁在AI十字路口的握手—从“能力恐慌”到“普惠共识”

    在2025GIS全球创新峰会上,杰弗里·辛顿与陈宁的对话超越了东西方AI理念的表面对立,勾勒出技术文明的新共识。双方在“AI向善”与“AI普惠”两个根本命题上达成深度共识:辛顿提出“更强AI”与“更安全AI”必须同步推进,标志着西方AI伦理讨论从哲学思辨转向工程实现;陈宁则为“向善”注入普惠维度,强调技术可及性是实现“善”的前提,提出“百倍降本”目标构建普惠的经济学基础。两人共同将“AI向善”从软性伦理倡导,塑造成包含安全机制与普惠能力的双重硬性标准。辛顿承认中国在AI治理上更具预防性优势,陈宁则倡议建立全球统一AI推理芯片标准,展现中国产业界正从技术应用者向全球规则贡献者迈进。这场对话揭示:未来全球AI治理可能需要融合西方的风险预警传统与中国的协同推进经验,伦理与工程必须融合,风险防控与普惠推广必须同步。当东西方顶尖智慧在根本目标上达成一致,人类或许真的找到了一条既能拥抱智能爆炸潜力,又能稳健穿越伦理迷雾的务实路径。

  • 蚂蚁的AI布局,不止“灵光”一现

    相比阿里千问的横空出世,蚂蚁集团(以下简称“蚂蚁”)这款通用AI应用“灵光”的爆火,有些出乎意料。 上周,蚂蚁发布的灵光App悄然登上了各大应用商店的榜首。仅仅上线6天,它的下载量就突破了200万大关。用创始团队的话来说,“这个结果提前完成了年底的KPI”。 随着ChatGPT用户超过8亿,豆包活跃用户超过1.72亿,千问上线一周拿下1000万用户,每个科技大厂依然要必

  • 罗永浩点赞豆包手机 称AI助手一定会遍地开花

    罗永浩发文支持豆包手机,称技术革命不可阻挡,无论大小应用或国家都无法阻拦。他赞扬字节跳动迈出第一步的勇气,并相信AI助手未来将如繁花般普及,成为生活不可或缺的一部分。此外,豆包手机系统软件中出现锤子科技遗留字样及经典铃声,引发网友猜测与讨论。

今日大家都在搜的词: