首页 > 业界 > 关键词  > SCEdit最新资讯  > 正文

阿里巴巴推AI画图框架SCEdit 可显著减少训练参数

2023-12-27 11:01 · 稿源:站长之家

站长之家(ChinaZ.com)12月27日 消息:阿里巴巴的新项目SCEdit是一个AI画图框架,可以显著减少训练参数、内存使用率和计算开销。在训练阶段,它减少了52%的内存消耗,仅利用ControlNet所需参数的7.9%,并实现内存使用量减少30%。

image.png

项目地址:https://scedit.github.io/

该项目的简介指出,图像扩散模型已被用于各种任务,如文本到图像生成和可控图像合成。最近的研究引入了微调方法,对原始模型进行细微调整,在基础生成式扩散模型的特定适应性方面取得了有希望的结果。

image.png

SCEdit并不是修改扩散模型的主干部分,而是深入研究U-Net中跳跃连接的作用,并揭示出在编码器和解码器之间聚合远程信息的分层特征对图像生成内容和质量产生重大影响。

基于这一观察,SCEdit提出了一个高效的生成式调整框架,它使用轻量级调节模块SC-Tuner来集成和编辑Skip Connection。此外,所提出的框架允许通过注入不同条件与可控SC-Tuner简化并统一多条件输入网络设计以实现可控图像合成任务。由于其轻量级调节器使得反向传播仅传递给解码器块,SCEdit显著减少了训练参数、内存使用率和计算开销。

在文本到图像生成和可控图像合成任务上进行了大量实验,结果表明SCEdit在效率和性能方面具有优势。同时,该项目也宣布了开源,尽管还没有提供具体的代码,但已经有开发者表示愿意帮助实现。

举报

  • 相关推荐
  • 全球首创!阿里巴巴AI攻克“癌症之王”早筛难题 获FDA最高级别认证

    快科技4月18日消息,据报道,阿里巴巴AI模型DAMO PANDA被FDA认定为突破性医疗器械”。DAMO PANDA是阿里巴巴达摩院研发的胰腺癌筛查AI模型,可精准识别平扫CT影像中的细微病灶,攻克了胰腺癌早期筛查的国际难题。这也是中国头部科技企业首次拿下该项权威认可。达摩院在国际上率先提出平扫CT AI”筛查方案,联合全球顶尖医学机构开发出DAMO PANDA模型。测试数据显示,其筛查敏感

  • 阿里巴巴正式开源千问3 仅需4张H20即可部署满血版

    阿里巴巴开源新一代通义千问模型Qwen3,采用混合推理架构,集成"快思考"与"慢思考"模式,能根据任务复杂度自动调整计算资源。该模型参数规模235B,在GPQA等权威评测中表现优异,以更小规模实现超越上一代模型的性能。Qwen3包含2款MoE模型和6款密集模型,部署成本大幅降低,仅需4张H20显卡即可运行满血版,显存占用仅为同类模型的三分之一。新模型通过智能分配算力,在简单任务上快速响应,复杂问题上深度思考,显著提升能效比。

  • AI 潜入Reddit,骗过99%人类!苏黎世大学操纵实测“AI洗脑术”,网友怒炸:我们是实验鼠?

    苏黎世大学研究团队在Reddit的"ChangeMyView"论坛进行未经授权的AI操控实验,引发争议。研究人员伪装成普通用户发布1783条评论,成功改变137名用户观点,说服率达18%。实验采用三类AI角色:通用AI、模仿社区风格的AI和个性化AI(根据用户历史定制说服策略)。最受争议的是AI会虚构身份(如性侵幸存者、残疾人士等)博取信任。尽管校方辩称实验旨在警示AI操控风险且内�

  • AI日报:Kimi全新音频基础模型Kimi-Audio;阶跃星辰开源像编辑模型Step1X-Edit;​夸克AI超级框上线 “拍照问夸克”

    本期AI日报聚焦多项AI技术突破与应用:1)Moonshot AI推出开源音频模型Kimi-Audio,基于13亿小时训练数据,支持语音识别等任务;2)阶跃星辰开源图像编辑模型Step1X-Edit,展现强大生成能力;3)夸克AI上线"拍照问夸克"功能,实现视觉问答;4)苹果iOS18.5将在中国推送,带来智能功能;5)谷歌发布601个生成式AI应用案例,覆盖多行业;6)微软推出深度整合Windows的UFO²自动化系统;7)OpenAI升级ChatGPT至GPT-4o版本,提升STEM领域能力;8)Ema公司推出高性价比语言模型EmaFusion;9)Liquid AI发布面向边缘设备的Hyena Edge模型;10)LemonAI推出实时音视频数字人产品Slice Live。此外,国内方面,智谱与生数科技达成战略合作推动大模型发展,宝马中国宣布新车将接入DeepSeek技术。

  • AI日报:ChatGPT重磅上线像库功能;白嫖!Veo2登陆谷歌AI Studio;蚂蚁百宝箱“MCP专区”

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、报道称字节跳动整合 AI 研发团队,AI Lab 即将并入 Seed字节跳动正在进行AI研发团队的整合,将独立的字节AI Lab并入Seed团队。这一举措体现了字节在AI领域战略布局的调整,旨在进�

  • 文创公司Windows 95经典“画图”挂镜:卖到2880元不便宜

    快科技4月18日消息,微软Windows系统中的画图”软件是许多用户的美好回忆,尤其是其在Windows 95到Windows XP期间的经典界面。如今,一家文创公司Drought将这一经典界面制作成了一面墙挂镜,售价高达395美元,约合人民币2880元。Drought是一家以街头风格为特色的文创品牌,过去曾推出过多种复古风格的商品,如巨大的iPod Nano落地镜和战斗陀螺皮带等。此次,他们推出的画图”镜子�

  • 阿里CEO呼吁阿里人重新创业 AI革命风险与机遇并存

    阿里巴巴集团CEO吴泳铭今日通过内网论坛发布全员信,呼吁全体员工在AI科技革命浪潮中回归创业初心,以“从零开始”的姿态迎接新挑战。他强调,阿里巴巴的基因中从未存在“守成”二字,唯有持续创造才能应对时代变革。

  • ChatGPT上线库功能:可管理AI生成图

    快科技4月16日消息,据报道,OpenAI近日宣布将为ChatGPT推出全新的Image Library图库功能,该功能将帮助用户更高效地管理和查看AI生成的图像。这项创新功能将逐步向所有用户开放,包括移动端和网页端的免费版、Plus版及Pro版用户。新功能的设计充分考虑了用户体验的便捷性。用户只需点击ChatGPT侧边栏的Library入口,就能进入一个直观的图像网格界面。在这个界面中,用户可以轻�

  • 阿里国际要靠AI破局

    走过前两年的低价厮杀与托管模式混战后,在当前全球贸易大变局下,跨境电商行业风云变幻。要在未来的不确定性中,寻找增长的确定性,作为阿里旗下聚焦海外电商的业务板块,阿里国际数字商业集团正在持续押注AI,希望助力商家走出“低价”竞争的漩涡,向“高附加值”转型。AI将带来一场外贸革命,在全球贸易局势的动荡中,马云口中的“AI电商”时代或许会加速到来,全球电商市场的竞争格局也将再次被改写。

  • 30岁华裔将成最年轻白手起家女富豪:是Scale AI联合创始人

    30岁华裔创业者郭露西以12.5亿美元身家成为全球最年轻白手起家女性亿万富豪。她22岁联合创办AI数据标注公司Scale AI,虽两年后退出但仍保留5%股份,随着公司估值从138亿跃升至250亿美元,其持股市值达12.5亿。郭露西随后创立创作者平台Passes,吸引邓恩、奥尼尔等名人入驻,估值1.5亿美元。这位旧金山湾区华裔二代从卡内基梅隆大学辍学创业,其财富轨迹印证了人工智能时代的技术红利。作为全球仅有的六位40岁以下白手起家女性亿万富豪之一,她表示"仍需保持清醒",继续在AI与内容经济交叉领域书写新的财富传奇。