首页 > 业界 > 关键词  > MagiCapture最新资讯  > 正文

韩国AI研究机构出品!MagiCapture:个性化生成高分辨率肖像照片

2023-09-19 14:29 · 稿源:站长之家

文章概要:

- MagiCapture是韩国AI研究机构的最新成果,致力于解决多概念定制挑战,实现高质量肖像照片的个性化生成。

- 该方法采用多概念定制,融合主题和风格概念,只需少量参考即可生成高分辨率肖像照片。

- 研究人员提供了新的注意力重新聚焦损失、即时学习策略,在定量和定性评估中明显优于基线方法。

站长之家(ChinaZ.com)9月19日 消息:韩国的一家人工智能研究机构近日发布了名为MagiCapture的新技术,该技术旨在解决肖像照片个性化生成的多概念定制挑战。传统上,人们需要前往照相馆,经历昂贵和耗时的图片编辑过程,才能获得适合简历或婚礼庆典等场合的高质量肖像照片。MagiCapture的目标是自动化这一过程,让用户只需使用几张自拍照和一些参考照片,即可获得特定风格的高分辨率肖像照片,如护照照片或个人资料照片。

image.png

这一技术的背后,是最新发展的大型文本到图像模型,如SD和Imagen等,使得高保真、逼真的肖像照片成为可能。目前,研究人员正致力于定制这些模型,以结合特定主题或美学。他们将这一挑战定义为多概念定制挑战,旨在让模型能够同时学习源材料和参考风格,生成复合输出。

与传统的文本驱动编辑不同,MagiCapture使用参考图片,让用户能够提供更细粒度的建议,从而使生成的肖像更加符合预期。然而,早期的个性化技术存在一个问题,即生成的图像常常缺乏真实感,而且在商业上难以应用。这主要是因为尝试仅用几张照片来更新大型模型的参数时,通常会导致不同概念的混合或与原始概念的分歧,这在肖像照片中尤为明显。

image.png

为了解决这一问题,MagiCapture采用了多概念定制方法,通过组合提示学习实现主题和风格创意的融合。这个过程将组合提示作为培训的一部分,并强化源材料和参考风格的紧密结合。辅助损失和假标签等技术被用来实现信息解缠和避免信息泄漏。这一方法在定量和定性评估中表现出比其他基线方法更好的性能,并且可以轻松应用于生成非人类物体的图像。

MagiCapture代表了肖像照片生成领域的一项重要技术突破,为用户提供了更便捷、个性化的肖像照片生成方法。通过多概念定制和新的学习策略,它成功地克服了传统个性化技术存在的问题,为高分辨率肖像照片的定制创造了更多可能性。

论文网址:https://arxiv.org/abs/2309.06895

举报

  • 相关推荐
  • 荣耀Magic8系列真机亮相!首批高通第五代骁龙8至尊版旗舰

    9月25日,高通发布第五代骁龙8至尊版,荣耀同步展示新旗舰Magic8系列。该系列采用独特天青釉配色,呈现宋瓷质感,背壳蝉翼纹路随光流转,融合传统与科技。搭载台积电3nm工艺,CPU采用2颗Oryon v2超大核(4.6GHz)+6大核(3.62GHz),GPU升级为Adreno,主频1.2GHz。工程机跑分超450万,预计荣耀能进一步发挥性能。荣耀Magic8系列将在10月发布,为首批搭载该芯片的旗舰之一,并有望在AI、影像上突破。同时,荣耀MagicPad3 Pro也将搭载同款芯片,刷新安卓平板性能极限。

  • 京东推出AI购物APP京犀:帮你选出最心仪商品

    9月25日,2025京东全球科技探索大会在京开幕。京东宣布未来三年将持续加大投入,推动人工智能技术与实体产业深度融合,目标构建覆盖全产业链的万亿级AI生态体系。作为战略落地的关键一步,京东正式推出新一代购物与生活服务超级入口“京犀”App,通过AI技术重构消费体验,引发行业高度关注。该应用将AI深度嵌入购物全流程,基于用户行为与商品特征精准理解需求,智能推荐商品并优化结算路径,实现“无感式”顺畅下单。平台整合餐饮、票务、住宿等高频生活服务场景,用户通过语音指令即可完成全流程操作。此次将AI能力全面开放至消费端,标志着京东从“供应链技术提供商”向“生活服务生态构建者”的角色升级。

  • ChatExcel重磅发布:基于AMD锐龙AI MAX+ 395处理器的数据分析Mini AI 工作站

    ChatExcel发布搭载AMD锐龙AI MAX+395处理器的Mini AI工作站,重构数据全链路,打造“找数-做数-分析数-看数-用数”的商业闭环平台。依托处理器96GB超大显存和统一内存架构,实现本地流畅运行GPT-oss-120B等大型模型,保障数据安全的同时显著提升分析效率。该方案以财务场景为例,支持多任务并行处理,将原本需1天完成的月度报表压缩至2小时,解决“数据不外发”与“高效处理”的核心矛盾。

  • 重磅官宣:嘉立创完成对Ican工具箱收购,即日起永久免费!

    嘉立创集团宣布收购Ican工具箱并永久免费后,为感谢历史付费用户支持,现已开启全额退款通道。退款对象为所有通过官方渠道购买过付费版的个人用户,需在2025年10月31日前凭购买凭证申请。此举体现"用户至上"理念,旨在回馈早期支持者。用户可访问官网"退款通道"入口,按指引提交申请。Ican工具箱含95+项实用功能,覆盖机械设计核心环节,现永久免费开放,助力行业进步。

  • 华为AI城市峰会:共建城市数智底座,AI CITY先锋城市案例发布

    9月18日,华为全联接大会2025期间举办AI城市峰会,聚焦智慧城市治理、政务服务与产业升级。华为发布“AI CITY 1234MNX”参考架构,通过智能云底座、安全保障体系及统一平台,推动城市全域智能化转型。会议分享了深圳、广州等地的实践案例,展示AI在政务、城市管理及工业领域的应用成效,并呼吁各方共建AI城市生态,加速数字化进程。

  • 目标安卓最强平板!荣耀MagicPad3 Pro全面对标iPad Pro、小米平板Ultra

    荣耀MagicPad3+Pro平板即将发布,将搭载第五代骁龙8至尊版芯片,配备13.3英寸超高刷大屏,首发MagicOS 10系统,支持PC级交互能力。对标iPad Pro和小米平板Ultra,目标成为安卓阵营最强平板。预计售价约5000元,因旗舰芯片成本较高。作为参考,荣耀MagicPad 3售价2999元起。

  • 曝苹果为新Siri做了内部版ChatGPT 正测试搜索个人数据、执行App内操作等功能

    苹果公司正在开发一款类似ChatGPT的手机应用“Veritas”,用于内部测试明年将推出的新版Siri。该应用可快速评估Siri新功能,包括搜索个人数据、执行App内操作(如编辑照片)等。虽然不面向消费者发布,但该工具标志着苹果对Siri的全面升级已进入新阶段,旨在帮助员工高效完成测试。

  • 聚焦科技运动融合!北京apm AI运动会引领沉浸商业体验升级

    北京APM于9月20日至21日举办“AI运动会”,集结多元智能机器人阵容,打造融合科技竞技与深度互动的沉浸式活动。活动以运动为核心,通过足球、拳击、马拉松等特色机器人项目,结合每日4场舞台表演和100个机器人领舞,直观呈现科技与运动的融合之美。现场设置AI互动环节,观众可体验机器人对抗赛、AI棋局对弈及机械臂操控,实现“科技可触、未来可感”。此次活动不仅是一场竞技盛宴,更以科技体验激发情感共鸣,通过沉浸式内容驱动消费新活力,突破传统商业增长极限,为城市商业生态注入创新动能。

  • Reviews.ai 依托 DigitalOcean 高效实现 AI 业务扩展

    Reviews.ai是一个消费者反馈聚合平台,帮助品牌将客户评论转化为可执行的洞察。该平台专注于评论分析,通过AI驱动功能(如按需报告、主题分类和智能代理)提升产品与服务。近期从Review Monitor更名后,团队迁移至DigitalOcean云平台,解决了原有专用服务器架构的扩展瓶颈。迁移过程在合作伙伴Aquazeel支持下高效完成,仅用数周,成本降低近30%。新架构采用Droplets、托管数据库和负载均衡器,支持灵活扩展。未来计划利用GPU Droplets增强AI能力,进一步优化大型语言模型处理效率。

  • 全球首个!OpenAI将推“AI版抖音”:禁止上传实拍内容 视频100%由AI生成

    国庆假期前夕,OpenAI发布了Sora 2,一款旗舰视频和音频生成模型。 据介绍,Sora 2可以完成以前的视频生成模型难以完成的事情,比如运动员的奥林匹克体动作、桨板上的后空翻,准确模拟浮力和刚度的动态等等,并擅长现实主义、电影和动漫风格。 一则来自《连线》杂志的重磅爆料更是指出,OpenAI的下一步棋,并非简单升级一个模型,而是要亲自下场,推出一个独立的AI影�

今日大家都在搜的词: