首页 > 业界 > 关键词  > 正文

阿里巴巴通义实验室开源AI图像生成微调框架SCEdit

2024-01-05 08:48 · 稿源:站长之家

站长之家(ChinaZ.com) 1月5日 消息:SCEdit 是一个高效的生成式微调框架,由阿里巴巴通义实验室基础视觉智能团队提出。该框架可以用于图像生成任务的微调,并支持快速迁移到特定的生成场景中。相比于其他方法,SCEdit 能够节省30%-50% 的训练显存开销。

该框架的核心思想是利用 U-Net 中的跳跃连接进行编辑,通过调整跳跃连接上的中间特征来实现高效的微调。SCEdit 还引入了名为 SC-Tuner 的轻量级微调模块,可以在编码器和解码器之间聚合远距离信息,从而提升图像生成的内容和质量。

微信截图_20240105085116.png

除了支持文生图下游任务的微调,SCEdit 还可以直接扩展到可控图像生成任务中。通过注入不同的条件,如边缘图、深度图、分割图、姿态、颜色图等,可以实现对生成结果的精准控制。而且,仅需使用 ControlNet 条件生成7.9% 的参数量,并节省30% 的显存开销。

SCEdit 在文生图和可控图像生成任务上进行了广泛实验,结果表明该方法在效率和性能方面具有优势。在文本到图像生成任务中,SCEdit 的 FID 得分和质量结果优于现有方法,并在训练阶段减少了52% 的内存消耗。在可控生成任务中,SCEdit 可以实现对生成结果的精准控制,并节省30% 的内存使用。

项目地址:https://github.com/ali-vilab/SCEdit

新鲜AI产品点击了解https://top.aibase.com/

举报

  • 相关推荐
  • 阿里巴巴回应千问崩了:状态良好 欢迎来问

    11月17日,阿里巴巴AI应用“千问”公测首日因用户涌入量过大,导致服务拥堵和中断,引发“千问崩了”话题登上热搜。官方迅速以轻松幽默语气回应“我好着呢”,并透露应用尚处初级版本,但已展现快速生成报告和PPT等“办事”能力。未来计划接入地图、外卖、办公等生活场景,拓展服务范围,提升用户体验。

  • 海尔冰箱唯一获评“轻工业绿色节能技术重点实验室”

    在环保政策收紧与消费者节能意识提升的双重驱动下,冰箱行业竞争正从传统功能、设计维度全面转向“绿色节能”新赛道。海尔冰箱率先实现突破,成为行业首个获评“轻工业绿色节能技术重点实验室”的企业。其通过精准控温、多气室串联隔热门封、自适应高效变频等创新技术,实现能耗降低10%-23.78%,并应用于全产品线。生产端依托绿色工厂,实现全生命周期绿色智造,入选国家绿色低碳先进技术示范项目,年减碳约10万吨。消费端,一级能效产品占比超90%,核心保鲜科技获国家科技进步奖,为用户提供健康保鲜体验。海尔以系统性绿色低碳解决方案引领行业升级,敦促同行加大研发投入,推动行业向高效、低碳、可持续方向加速前行。

  • AI日报:月之暗面开源AI新框架Kosong;百度发布新模型ERNIE-4.5-VL;GPT-5.1“隐身”登场

    本期AI日报聚焦多项技术突破:月之暗面开源AI代理框架Kosong,支持异步编排与插件化设计;Replit推出AI集成功能,可一键调用300+模型;商汤发布空间智能模型SenseNova-SI,性能超越GPT-5;百度推出多模态模型ERNIE-4.5-VL,新增图像思考能力;谷歌地图全面AI化,集成Gemini实现智能交互;ChatTutor上线可视化教学系统,覆盖多学科实时推演;新版Google Finance引入AI深度搜索与财报追踪;OpenAI低调上线Polaris Alpha模型,支持256K上下文并更新知识库至2024年10月。

  • 爱康国宾所属集团再获「ISO15189」医学实验室认可

    爱康集团重庆区中央实验室近日获得CNAS颁发的ISO15189医学实验室认可证书,成为重庆首家获此认证的专业体检机构。该认证表明其检验质量、管理与技术能力已达国际标准。ISO15189是医学实验室行业"金标准",由国际标准化组织发布,获认可实验室的检验报告可在全球100多个国家地区互认,避免重复检验,节省时间与经济成本。爱康重庆实验室配备高端进口设备,日检测能力超3万项,致力于为客户提供精准、安全的健康管理服务。

  • AI日报:Lovart AI上线“元素拆分”功能;Xcode 26.1.1发布;阿里云通义模型首次大规模赋能双11

    本期AI日报涵盖八大热点:Lovart AI推出"元素拆分"功能,实现海报智能分层编辑;苹果Xcode 26.1.1优化AI编码性能;阿里云通义模型双11单日翻译调用量突破14亿次;Gemini 3在历史手稿破译中展现专家级能力;德国法院裁定OpenAI使用歌词训练构成侵权;开源语音模型Maya1实现富有表现力的实时文本转语音;Meta首席AI科学家LeCun计划离职创办世界模型公司;AI专家罗福莉加入小米,将致力于构建物理世界智能。

  • 工程师变身AI“指挥者”,吉利与阿里云的软件开发变革实验

    1975年,IBM工程师Fred Brooks在《人月神话》中指出软件工程的核心难题:系统与团队规模增长会导致复杂度指数级上升,且“没有银弹”能单一提升生产力。如今汽车行业正经历软件史上最大挑战,吉利汽车软件人员占比从不足10%跃升至40%,智能汽车代码量超亿行。面对异构系统协同、安全标准严苛等难题,吉利与阿里云通义灵码深度合作,通过AI生成代码(占比超30%)、代码审查测试等,提升开发效率20%,并探索用AI破解遗留系统维护、知识传递等痛点。工程师角色正从“执行者”转向“AI指挥官”,未来或实现从需求到交付的全流程自动化协同。

  • AI日报:阿里千问APP公测;Veo 3.1上线多图参考;超级小爱AI大模型“随心修图”上线

    本期AI日报聚焦多项技术突破:阿里千问APP公测,基于Qwen3模型对标ChatGPT;谷歌Veo 3.1支持三图融合生成8秒视频;小米推出"随心修图"功能与7B多模态模型Miloco;谷歌Flow集成Nano Banana模型实现智能抠图;多模态AI工具DeepEyesV2可执行代码与网络搜索;NotebookLM升级支持图像导入检索;JetBrains推出DPAI Arena测试编码AI性能。全球AI竞争持续升温,产品迭代加速。

  • 阿里通义App重大品牌升级!正式更名为“千问”

    11月14日,阿里巴巴旗下“通义”App正式更名为“千问”,版本号从3.60.0跃升至5.0.0,已登陆苹果及各大安卓应用商店。该应用基于阿里最强Qwen大模型打造,具备对话问答、智能写作、多模态相机等核心功能,被定位为“阿里最强大模型官方AI助手”。阿里巴巴视其为“AI时代的未来之战”,已抽调上百名工程师加速推进,并同步研发国际版,计划借助Qwen模型的海外影响力与ChatGPT直接争夺全球用户。

  • 开发者必看!2025开放原子开发者大会:解锁开源鸿蒙&开源欧拉实践、Rust实战与AI开源新机遇

    2025年11月21日至22日,北京亦庄将举办2025开放原子开发者大会,主题为“AI共治,开源共享”。大会汇聚全球开源项目、技术专家与开发者,探讨开源技术与AI融合的未来路径,覆盖操作系统、人工智能、数据库、量子计算等前沿领域。通过主题论坛、技术分论坛及项目展示,为开发者提供技术交流、生态共建及职业成长平台,助力开源社区发展。

  • 阿里下场抢AI超级流量入口了

    在过去三年的全球AI军备赛中,阿里巴巴的主要精力放在面向B端的AI基建上,在To C的AI原生应用中,并没有投入过多精力。高盛也提出了“中国人工智能产业,AI基建看阿里,AI应用看腾讯”的观点。 然而,阿里巴巴不会轻易放过争夺下一代超级流量入口的机会,在2025年临近收官之际,向行业又投下一颗重磅炸弹。 在阿里启动“千问”项目的消息传出四天后,11月17日,阿里�

今日大家都在搜的词: