韩国AI研究机构出品!MagiCapture:个性化生成高分辨率肖像照片

2023-09-19 14:29 · 稿源：站长之家

文章概要:
- MagiCapture是韩国AI研究机构的最新成果，致力于解决多概念定制挑战，实现高质量肖像照片的个性化生成。
- 该方法采用多概念定制，融合主题和风格概念，只需少量参考即可生成高分辨率肖像照片。
- 研究人员提供了新的注意力重新聚焦损失、即时学习策略，在定量和定性评估中明显优于基线方法。

站长之家（ChinaZ.com）9月19日消息:韩国的一家人工智能研究机构近日发布了名为MagiCapture的新技术，该技术旨在解决肖像照片个性化生成的多概念定制挑战。传统上，人们需要前往照相馆，经历昂贵和耗时的图片编辑过程，才能获得适合简历或婚礼庆典等场合的高质量肖像照片。MagiCapture的目标是自动化这一过程，让用户只需使用几张自拍照和一些参考照片，即可获得特定风格的高分辨率肖像照片，如护照照片或个人资料照片。

这一技术的背后，是最新发展的大型文本到图像模型，如SD和Imagen等，使得高保真、逼真的肖像照片成为可能。目前，研究人员正致力于定制这些模型，以结合特定主题或美学。他们将这一挑战定义为多概念定制挑战，旨在让模型能够同时学习源材料和参考风格，生成复合输出。

与传统的文本驱动编辑不同，MagiCapture使用参考图片，让用户能够提供更细粒度的建议，从而使生成的肖像更加符合预期。然而，早期的个性化技术存在一个问题，即生成的图像常常缺乏真实感，而且在商业上难以应用。这主要是因为尝试仅用几张照片来更新大型模型的参数时，通常会导致不同概念的混合或与原始概念的分歧，这在肖像照片中尤为明显。

为了解决这一问题，MagiCapture采用了多概念定制方法，通过组合提示学习实现主题和风格创意的融合。这个过程将组合提示作为培训的一部分，并强化源材料和参考风格的紧密结合。辅助损失和假标签等技术被用来实现信息解缠和避免信息泄漏。这一方法在定量和定性评估中表现出比其他基线方法更好的性能，并且可以轻松应用于生成非人类物体的图像。

MagiCapture代表了肖像照片生成领域的一项重要技术突破，为用户提供了更便捷、个性化的肖像照片生成方法。通过多概念定制和新的学习策略，它成功地克服了传统个性化技术存在的问题，为高分辨率肖像照片的定制创造了更多可能性。

论文网址:https://arxiv.org/abs/2309.06895

（举报）

相关推荐

关键词：

荣耀Magic8系列真机亮相！首批高通第五代骁龙8至尊版旗舰

9月25日，高通发布第五代骁龙8至尊版，荣耀同步展示新旗舰Magic8系列。该系列采用独特天青釉配色，呈现宋瓷质感，背壳蝉翼纹路随光流转，融合传统与科技。搭载台积电3nm工艺，CPU采用2颗Oryon v2超大核（4.6GHz）+6大核（3.62GHz），GPU升级为Adreno，主频1.2GHz。工程机跑分超450万，预计荣耀能进一步发挥性能。荣耀Magic8系列将在10月发布，为首批搭载该芯片的旗舰之一，并有望在AI、影像上突破。同时，荣耀MagicPad3 Pro也将搭载同款芯片，刷新安卓平板性能极限。

第五代骁龙8至尊版荣耀Magic8系列天青釉配色
京东推出AI购物APP京犀：帮你选出最心仪商品

9月25日，2025京东全球科技探索大会在京开幕。京东宣布未来三年将持续加大投入，推动人工智能技术与实体产业深度融合，目标构建覆盖全产业链的万亿级AI生态体系。作为战略落地的关键一步，京东正式推出新一代购物与生活服务超级入口“京犀”App，通过AI技术重构消费体验，引发行业高度关注。该应用将AI深度嵌入购物全流程，基于用户行为与商品特征精准理解需求，智能推荐商品并优化结算路径，实现“无感式”顺畅下单。平台整合餐饮、票务、住宿等高频生活服务场景，用户通过语音指令即可完成全流程操作。此次将AI能力全面开放至消费端，标志着京东从“供应链技术提供商”向“生活服务生态构建者”的角色升级。

京东科技 AI生态京犀App
ChatExcel重磅发布：基于AMD锐龙AI MAX+ 395处理器的数据分析Mini AI 工作站

ChatExcel发布搭载AMD锐龙AI MAX+395处理器的Mini AI工作站，重构数据全链路，打造“找数-做数-分析数-看数-用数”的商业闭环平台。依托处理器96GB超大显存和统一内存架构，实现本地流畅运行GPT-oss-120B等大型模型，保障数据安全的同时显著提升分析效率。该方案以财务场景为例，支持多任务并行处理，将原本需1天完成的月度报表压缩至2小时，解决“数据不外发”与“高效处理”的核心矛盾。

文章搜索核心标签 AMD锐龙AI
重磅官宣：嘉立创完成对Ican工具箱收购，即日起永久免费！

嘉立创集团宣布收购Ican工具箱并永久免费后，为感谢历史付费用户支持，现已开启全额退款通道。退款对象为所有通过官方渠道购买过付费版的个人用户，需在2025年10月31日前凭购买凭证申请。此举体现"用户至上"理念，旨在回馈早期支持者。用户可访问官网"退款通道"入口，按指引提交申请。Ican工具箱含95+项实用功能，覆盖机械设计核心环节，现永久免费开放，助力行业进步。

嘉立创 Ican工具箱全额退款
华为AI城市峰会：共建城市数智底座，AI CITY先锋城市案例发布

9月18日，华为全联接大会2025期间举办AI城市峰会，聚焦智慧城市治理、政务服务与产业升级。华为发布“AI CITY 1234MNX”参考架构，通过智能云底座、安全保障体系及统一平台，推动城市全域智能化转型。会议分享了深圳、广州等地的实践案例，展示AI在政务、城市管理及工业领域的应用成效，并呼吁各方共建AI城市生态，加速数字化进程。

AI城市智慧政务产业数智升级
目标安卓最强平板！荣耀MagicPad3 Pro全面对标iPad Pro、小米平板Ultra

荣耀MagicPad3+Pro平板即将发布，将搭载第五代骁龙8至尊版芯片，配备13.3英寸超高刷大屏，首发MagicOS 10系统，支持PC级交互能力。对标iPad Pro和小米平板Ultra，目标成为安卓阵营最强平板。预计售价约5000元，因旗舰芯片成本较高。作为参考，荣耀MagicPad 3售价2999元起。

荣耀MagicPad3 Pro 第五代骁龙8至尊版
曝苹果为新Siri做了内部版ChatGPT 正测试搜索个人数据、执行App内操作等功能

苹果公司正在开发一款类似ChatGPT的手机应用“Veritas”，用于内部测试明年将推出的新版Siri。该应用可快速评估Siri新功能，包括搜索个人数据、执行App内操作（如编辑照片）等。虽然不面向消费者发布，但该工具标志着苹果对Siri的全面升级已进入新阶段，旨在帮助员工高效完成测试。

苹果 Siri ChatGPT
聚焦科技运动融合！北京apm AI运动会引领沉浸商业体验升级

北京APM于9月20日至21日举办“AI运动会”，集结多元智能机器人阵容，打造融合科技竞技与深度互动的沉浸式活动。活动以运动为核心，通过足球、拳击、马拉松等特色机器人项目，结合每日4场舞台表演和100个机器人领舞，直观呈现科技与运动的融合之美。现场设置AI互动环节，观众可体验机器人对抗赛、AI棋局对弈及机械臂操控，实现“科技可触、未来可感”。此次活动不仅是一场竞技盛宴，更以科技体验激发情感共鸣，通过沉浸式内容驱动消费新活力，突破传统商业增长极限，为城市商业生态注入创新动能。

AI运动会科技竞技智能机器人
Reviews.ai 依托 DigitalOcean 高效实现 AI 业务扩展

Reviews.ai是一个消费者反馈聚合平台，帮助品牌将客户评论转化为可执行的洞察。该平台专注于评论分析，通过AI驱动功能（如按需报告、主题分类和智能代理）提升产品与服务。近期从Review Monitor更名后，团队迁移至DigitalOcean云平台，解决了原有专用服务器架构的扩展瓶颈。迁移过程在合作伙伴Aquazeel支持下高效完成，仅用数周，成本降低近30%。新架构采用Droplets、托管数据库和负载均衡器，支持灵活扩展。未来计划利用GPU Droplets增强AI能力，进一步优化大型语言模型处理效率。

消费者反馈品牌洞察评论分析
全球首个！OpenAI将推“AI版抖音”：禁止上传实拍内容视频100%由AI生成

国庆假期前夕，OpenAI发布了Sora 2，一款旗舰视频和音频生成模型。据介绍，Sora 2可以完成以前的视频生成模型难以完成的事情，比如运动员的奥林匹克体动作、桨板上的后空翻，准确模拟浮力和刚度的动态等等，并擅长现实主义、电影和动漫风格。一则来自《连线》杂志的重磅爆料更是指出，OpenAI的下一步棋，并非简单升级一个模型，而是要亲自下场，推出一个独立的AI影�

OpenAI Sora 2

今日大家都在搜的词：

热文

3 天
7天

韩国AI研究机构出品!MagiCapture:个性化生成高分辨率肖像照片

荣耀Magic8系列真机亮相！首批高通第五代骁龙8至尊版旗舰

京东推出AI购物APP京犀：帮你选出最心仪商品

ChatExcel重磅发布：基于AMD锐龙AI MAX+ 395处理器的数据分析Mini AI 工作站

重磅官宣：嘉立创完成对Ican工具箱收购，即日起永久免费！

华为AI城市峰会：共建城市数智底座，AI CITY先锋城市案例发布

目标安卓最强平板！荣耀MagicPad3 Pro全面对标iPad Pro、小米平板Ultra

曝苹果为新Siri做了内部版ChatGPT 正测试搜索个人数据、执行App内操作等功能

聚焦科技运动融合！北京apm AI运动会引领沉浸商业体验升级

Reviews.ai 依托 DigitalOcean 高效实现 AI 业务扩展

全球首个！OpenAI将推“AI版抖音”：禁止上传实拍内容视频100%由AI生成

今日大家都在搜的词：

热文

比特币价格突破12.5万美元刷新历史最高纪录

腾讯混元图像3.0登顶LMArena榜一

乔布斯逝世14周年库克发文缅怀：我们深切怀念你

小米 17 标准版1TB版本 5299 元开售全系列销量同比增超20%

雷军：小米17系列开售仅5天销量破100万台

理想汽车推出焕新版L系限时优惠 10 月 8 日前享1.5万置换补贴

小米回应“小米汽车突然自己开走”：排除车辆质量问题

马斯克个人财富达5000亿美元特斯拉市值飙升助力

鸿蒙智行9月交付新车52916台：全系累计交付突破95万台

比特币价格突破12.5万美元刷新历史最高纪录

小米17 1TB版明日开售售价5299元

乔布斯逝世14周年库克发文缅怀：我们深切怀念你

腾讯混元图像3.0登顶LMArena榜一

小米 17 标准版1TB版本 5299 元开售全系列销量同比增超20%

雷军：小米17系列开售仅5天销量破100万台

站长商机