阿里巴巴通义实验室开源AI图像生成微调框架SCEdit

2024-01-05 08:48 · 稿源：站长之家

站长之家(ChinaZ.com) 1月5日消息:SCEdit 是一个高效的生成式微调框架，由阿里巴巴通义实验室基础视觉智能团队提出。该框架可以用于图像生成任务的微调，并支持快速迁移到特定的生成场景中。相比于其他方法，SCEdit 能够节省30%-50% 的训练显存开销。

该框架的核心思想是利用 U-Net 中的跳跃连接进行编辑，通过调整跳跃连接上的中间特征来实现高效的微调。SCEdit 还引入了名为 SC-Tuner 的轻量级微调模块，可以在编码器和解码器之间聚合远距离信息，从而提升图像生成的内容和质量。

微信截图_20240105085116.png

除了支持文生图下游任务的微调，SCEdit 还可以直接扩展到可控图像生成任务中。通过注入不同的条件，如边缘图、深度图、分割图、姿态、颜色图等，可以实现对生成结果的精准控制。而且，仅需使用 ControlNet 条件生成7.9% 的参数量，并节省30% 的显存开销。

SCEdit 在文生图和可控图像生成任务上进行了广泛实验，结果表明该方法在效率和性能方面具有优势。在文本到图像生成任务中，SCEdit 的 FID 得分和质量结果优于现有方法，并在训练阶段减少了52% 的内存消耗。在可控生成任务中，SCEdit 可以实现对生成结果的精准控制，并节省30% 的内存使用。

项目地址：https://github.com/ali-vilab/SCEdit

新鲜AI产品点击了解：https://top.aibase.com/

（举报）

相关推荐

关键词：

阿里巴巴回应千问崩了：状态良好欢迎来问

11月17日，阿里巴巴AI应用“千问”公测首日因用户涌入量过大，导致服务拥堵和中断，引发“千问崩了”话题登上热搜。官方迅速以轻松幽默语气回应“我好着呢”，并透露应用尚处初级版本，但已展现快速生成报告和PPT等“办事”能力。未来计划接入地图、外卖、办公等生活场景，拓展服务范围，提升用户体验。

阿里巴巴千问崩了 AI应用
海尔冰箱唯一获评“轻工业绿色节能技术重点实验室”

在环保政策收紧与消费者节能意识提升的双重驱动下，冰箱行业竞争正从传统功能、设计维度全面转向“绿色节能”新赛道。海尔冰箱率先实现突破，成为行业首个获评“轻工业绿色节能技术重点实验室”的企业。其通过精准控温、多气室串联隔热门封、自适应高效变频等创新技术，实现能耗降低10%-23.78%，并应用于全产品线。生产端依托绿色工厂，实现全生命周期绿色智造，入选国家绿色低碳先进技术示范项目，年减碳约10万吨。消费端，一级能效产品占比超90%，核心保鲜科技获国家科技进步奖，为用户提供健康保鲜体验。海尔以系统性绿色低碳解决方案引领行业升级，敦促同行加大研发投入，推动行业向高效、低碳、可持续方向加速前行。

环保政策绿色节能冰箱行业
荐AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.5-VL；GPT-5.1“隐身”登场

本期AI日报聚焦多项技术突破：月之暗面开源AI代理框架Kosong，支持异步编排与插件化设计；Replit推出AI集成功能，可一键调用300+模型；商汤发布空间智能模型SenseNova-SI，性能超越GPT-5；百度推出多模态模型ERNIE-4.5-VL，新增图像思考能力；谷歌地图全面AI化，集成Gemini实现智能交互；ChatTutor上线可视化教学系统，覆盖多学科实时推演；新版Google Finance引入AI深度搜索与财报追踪；OpenAI低调上线Polaris Alpha模型，支持256K上下文并更新知识库至2024年10月。

AI代理开源框架异步编排
爱康国宾所属集团再获「ISO15189」医学实验室认可

爱康集团重庆区中央实验室近日获得CNAS颁发的ISO15189医学实验室认可证书，成为重庆首家获此认证的专业体检机构。该认证表明其检验质量、管理与技术能力已达国际标准。ISO15189是医学实验室行业"金标准"，由国际标准化组织发布，获认可实验室的检验报告可在全球100多个国家地区互认，避免重复检验，节省时间与经济成本。爱康重庆实验室配备高端进口设备，日检测能力超3万项，致力于为客户提供精准、安全的健康管理服务。

ISO15189 医学检验金标准
荐AI日报：Lovart AI上线“元素拆分”功能；Xcode 26.1.1发布；阿里云通义模型首次大规模赋能双11

本期AI日报涵盖八大热点：Lovart AI推出"元素拆分"功能，实现海报智能分层编辑；苹果Xcode 26.1.1优化AI编码性能；阿里云通义模型双11单日翻译调用量突破14亿次；Gemini 3在历史手稿破译中展现专家级能力；德国法院裁定OpenAI使用歌词训练构成侵权；开源语音模型Maya1实现富有表现力的实时文本转语音；Meta首席AI科学家LeCun计划离职创办世界模型公司；AI专家罗福莉加入小米，将致力于构建物理世界智能。

AI设计元素拆分海报编辑
工程师变身AI“指挥者”，吉利与阿里云的软件开发变革实验

1975年，IBM工程师Fred Brooks在《人月神话》中指出软件工程的核心难题：系统与团队规模增长会导致复杂度指数级上升，且“没有银弹”能单一提升生产力。如今汽车行业正经历软件史上最大挑战，吉利汽车软件人员占比从不足10%跃升至40%，智能汽车代码量超亿行。面对异构系统协同、安全标准严苛等难题，吉利与阿里云通义灵码深度合作，通过AI生成代码（占比超30%）、代码审查测试等，提升开发效率20%，并探索用AI破解遗留系统维护、知识传递等痛点。工程师角色正从“执行者”转向“AI指挥官”，未来或实现从需求到交付的全流程自动化协同。

软件工程复杂度智能汽车
荐AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大模型“随心修图”上线

本期AI日报聚焦多项技术突破：阿里千问APP公测，基于Qwen3模型对标ChatGPT；谷歌Veo 3.1支持三图融合生成8秒视频；小米推出"随心修图"功能与7B多模态模型Miloco；谷歌Flow集成Nano Banana模型实现智能抠图；多模态AI工具DeepEyesV2可执行代码与网络搜索；NotebookLM升级支持图像导入检索；JetBrains推出DPAI Arena测试编码AI性能。全球AI竞争持续升温，产品迭代加速。

AI 阿里巴巴千问APP
阿里通义App重大品牌升级！正式更名为“千问”

11月14日，阿里巴巴旗下“通义”App正式更名为“千问”，版本号从3.60.0跃升至5.0.0，已登陆苹果及各大安卓应用商店。该应用基于阿里最强Qwen大模型打造，具备对话问答、智能写作、多模态相机等核心功能，被定位为“阿里最强大模型官方AI助手”。阿里巴巴视其为“AI时代的未来之战”，已抽调上百名工程师加速推进，并同步研发国际版，计划借助Qwen模型的海外影响力与ChatGPT直接争夺全球用户。

通义App 千问App 阿里大模型
开发者必看！2025开放原子开发者大会：解锁开源鸿蒙&开源欧拉实践、Rust实战与AI开源新机遇

2025年11月21日至22日，北京亦庄将举办2025开放原子开发者大会，主题为“AI共治，开源共享”。大会汇聚全球开源项目、技术专家与开发者，探讨开源技术与AI融合的未来路径，覆盖操作系统、人工智能、数据库、量子计算等前沿领域。通过主题论坛、技术分论坛及项目展示，为开发者提供技术交流、生态共建及职业成长平台，助力开源社区发展。

开源技术 AI共治开发者大会
千问登场，阿里瞄准C端关键一战

2023年9月，在正式接任CEO的第三天，吴泳铭发布的首份阿里全员信，宣布了阿里新的战略重点方向:用户为先、AI驱动。当时行业内更多把它视为一家企业在AI时代的惯性表述。然而，就在过去一年中，围绕AI在C端用户场景的“可能性”，全球AI行业的叙事逻辑已经发生了明显转向。 OpenAI在完成大模型能力的“基座化”后，开始把更多资源押在C端生态。过去两年，随着GPT-5等产�

文章搜索核心标签 AI驱动

今日大家都在搜的词：

热文

3 天
7天

阿里巴巴通义实验室开源AI图像生成微调框架SCEdit

阿里巴巴回应千问崩了：状态良好欢迎来问

海尔冰箱唯一获评“轻工业绿色节能技术重点实验室”

荐AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.5-VL；GPT-5.1“隐身”登场

爱康国宾所属集团再获「ISO15189」医学实验室认可

荐AI日报：Lovart AI上线“元素拆分”功能；Xcode 26.1.1发布；阿里云通义模型首次大规模赋能双11

工程师变身AI“指挥者”，吉利与阿里云的软件开发变革实验

荐AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大模型“随心修图”上线

阿里通义App重大品牌升级！正式更名为“千问”

开发者必看！2025开放原子开发者大会：解锁开源鸿蒙&开源欧拉实践、Rust实战与AI开源新机遇

千问登场，阿里瞄准C端关键一战

今日大家都在搜的词：

热文

华为Mate X7外观公布搭载全新折叠玄武架构

AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；

AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异

董明珠再回应玫瑰空调：创新尝试打造家电艺术品

华为Mate X7今日开启预订搭载第二代红枫影像等配置

苹果回应iPhone17PM被湿巾擦掉色：高浓度酒精或是诱因

华为Mate 80系列首发户外探索模式实现14天极限续航

快手发布2025年第三季度财报：可灵AI营业收入超3亿元

参与开发iPhoneAir设计师离职转投AI初创公司

小米端到端辅助驾驶“Xiaomi HAD增强版”将于11月12日发布

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

华为Mate 80/Pro/Pro Max/RS开启预约：全系直屏设计

AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大

华为Mate X7外观公布搭载全新折叠玄武架构

AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；

阿里巴巴回应千问崩了：状态良好欢迎来问

荣耀500系列官宣将于11月24日发布

一加Ace 6T官宣将于本月发布：首发骁龙8 Gen5

AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异

站长商机