首页 > 业界 > 关键词  > 图像生成模型最新资讯  > 正文

PS天塌了!阿里开源全新图像模型Qwen-Image-Layered 可实现PS级图层

2025-12-22 16:32 · 稿源: 快科技

12月22日,阿里巴巴集团发布并开源了其最新的图像生成模型Qwen-Image-Layered”。该模型的核心突破在于,能够像专业图像处理软件一样,理解并生成具有分层结构的图像,从而实现了对图像内容进行精准、可分离的编辑。

据悉,传统视觉模型在处理图像时,通常将其视为一个不可分割的“扁平”像素集合,这导致对图像中任何元素的修改都可能引发整体画面的不可控变化。而新模型通过创新的自研架构,成功模拟了专业设计软件中的图层工作逻辑。它能够将图像智能分解为多个独立图层,并理解物体间的空间关系(如远近、遮挡),从而允许用户对特定图层进行移动、缩放或重绘等操作,同时保持其他部分的高度一致性。

这一技术进展,旨在解决当前AI图像生成领域长期存在的“编辑一致性”难题。在商业广告、UI设计、影视后期等对精度要求极高的专业领域,传统AI生图工具的随机性往往使其仅能作为创意参考。Qwen-Image-Layered模型通过引入对透明通道(Alpha Channel)的结构化理解与全新的模型架构,使得AI生成的图像从“一次性成品”转变为可灵活、精准调整的“素材库”,显著提升了其在专业工作流中的实用价值。

Qwen-Image-Layered模型架构示意图

Qwen-Image-Layered模型架构示意图

技术团队透露,为了使模型具备这种“分层思维”,其训练数据来源于海量的专业设计源文件,从中学习真实的图层组织逻辑。这种基于物理空间关系的理解方式,标志着视觉大模型的研究方向正从单纯的像素预测,向更深层的结构理解与重组演进。

行业观察人士认为,该模型的推出,有望为数字内容创作带来实质性变革。设计及影视制作人员可以直接在生成结果上进行局部、非破坏性的编辑,无需复杂的后期抠图与合成,这将大幅提升创作效率与灵活性。

目前,Qwen-Image-Layered模型已在主流开源社区平台公开,供开发者与研究机构免费下载并用于商业用途。数据显示,阿里巴巴开源的通义千问系列模型累计下载量已突破7亿次,服务企业客户超百万家,在中国企业级模型市场中占据领先地位。

举报

  • 相关推荐
  • AI日报:Seedance2.0紧急暂停真人参考功能;Qwen-Image-2.0发布;混元推首个产业级2Bit端侧模型

    本期AI日报聚焦行业动态:腾讯推出首个产业级2Bit端侧模型,实现小体积高性能,适用于手机等隐私敏感场景;蚂蚁阿福成为央视健康生活合作伙伴,单日健康咨询达千万次;ChatGPT免费版将引入广告,OpenAI明确隐私保护规则;字节Seedance2.0因肖像争议暂停真人参考功能;华为发布全球首个虚实融合视频模型,实现毫秒级实时交互;Cursor发布Composer1.5,性能提升显著;阿里云推出Qwen-Image-2.0,图像生成与编辑能力合一;亚马逊入局内容授权市场,微软争夺高质量数据资源。

  • 千问Qwen-Image-2.0发布!超强文字渲染 信息图 PPT轻松做

    今日,阿里巴巴正式发布新一代图像生成及编辑模型Qwen-Image-2.0。 作为千问大模型的图像生成模型底座,Qwen-Image-2.0集生图和编辑于一体,在AI Arena文生图评测中斩获1029分,超过Seedream4.5、Flux2-Max等模型,仅次于谷歌Nano Banana Pro和GPT Image1.5。 Qwen-Image-2.0支持1K token的超长文字输入和2K高分辨率,可准确渲染复杂指令,轻松生成专业的PPT及信息图,质感媲美专业级摄影师;同时,�

  • AI日报:豆包2.0将于情人节发布;MiniMax M2.5 正式发布;小米开源首代机器人 VLA 大模型

    本期AI日报聚焦多项技术进展:字节跳动火山引擎发布“豆包”系列2.0版本,旨在降低专业内容生产门槛;MiniMAX M2.5模型开启海外内测,加速全球化布局;小米开源首款机器人VLA大模型,突破物理智能延迟瓶颈;百度千帆推出集成主流大模型的AI编码订阅服务Coding Plan;智谱发布GLM-5,迈向工程构建的Agentic Ready时代;DeepSeek上下文长度跃升至1M,处理能力大幅提升;Rokid眼镜新增�

  • 豆包视频生成模型Seedance 2.0正式接入豆包 暂不支持上传真人图片

    今日,豆包正式对外宣布,其自主研发的视频生成模型 Seedance2.0已全面接入豆包 App、电脑端及网页版,为用户带来前所未有的视频创作体验。此次升级,字节跳动再次展现了其在视频生成技术领域的领先地位。 用户只需打开豆包 App 对话框,即可发现新增的“Seedance2.0”入口。点击进入后,通过输入相关提示词,用户便能轻松生成5秒或10秒的精彩视频。更令人兴奋的是,豆包�

  • ​积分限免!字节跳动视频生成大模型Seedance 2.0接入剪映App

    字节跳动旗下视频生成大模型Seedance2.0已接入剪映App,用户更新至18.8.0版本后即可体验。该模型在视频编辑维度实现重大革新,支持像素级元素增删,官方称“让视频精修如P图般简单”。春节期间剪映推出积分限免活动,但明确暂不支持真人面孔生成功能,以规避伦理争议。模型上线后引发全球关注,马斯克转发演示视频并评论“进化速度惊人”。海外创作者实测显示,其生成的15秒视频在运镜、光影和角色一致性上达专业水准,部分作品被赞“媲美好莱坞特效”。面对外界赞誉,字节跳动保持谨慎态度,指出当前版本在细节稳定性、多人口型同步等方面仍存不足,需持续优化。研发团队透露,正构建更精细的物理世界模拟引擎,以解决流体流动、布料褶皱等动态效果难题。

  • 字节跳动旗下火山引擎发布视频生成大模型Seedance2.0

    字节跳动旗下火山引擎近日发布的视频生成大模型Seedance2.0,凭借“导演级”创作能力引发全球AI圈震动。这款在1.5Pro版本基础上迭代升级的模型,不仅攻克了人物一致性、视听同步等长期困扰行业的难题,更通过自动生成专业镜头切换功能,被业内人士评价为“可能抢走专业导演饭碗”的突破性产品。

  • 实时生成开放世界:新AI模型贴脸开大,游戏研发慌不慌?

    这两天,又有一款全新的AI模型出现了。 虽说如今AI改变各行各业的事情早就屡见不鲜,在游戏业,很多岗位也或多或少已经用上了AI技术,但最近发布的这款AI模型,它真不一样。 这款AI模型名叫PixVerse R1,按官方说法,PixVerse R1是全球首个真正意义上的「实时生成世界模型(Real-time World Model)」。

  • 字节跳动即梦AI视频生成模型Seedance2.0怎么用?Seedance 2.0在哪?

    字节跳动旗下即梦平台近日正式上线新一代AI视频生成模型Seedance2.0,凭借多模态参考、高效创作与后期编辑融合等核心突破,成为影视、广告、短视频创作领域的焦点。该模型支持同时上传12个参考文件(图片、视频、音频),可精准复刻运镜逻辑、动作细节与音乐氛围,生成15秒视频仅需约30积分,较前代速度提升超10倍,显著降低废片率。

  • 重新定义“实时在线交互”,Soul App开源实时数字人生成模型SoulX-FlashTalk

    Soul AI Lab开源实时数字人生成模型SoulX-FlashTalk,实现0.87秒亚秒级超低延迟、32fps高帧率,支持超长视频稳定生成。该模型具备“零延迟”即时反馈、高精细度全身动作合成、超长视频稳定生成等亮点,通过双向蒸馏与多步回溯自校正机制解决传统方案延迟高、画面不一致等问题。在电商直播、短视频制作、AI客服等场景提供高质量、可落地的解决方案,推动大参数量实时生成式数字人迈入具体商用阶段。

  • AI日报:蚂蚁开源大模型Ming-flash-omni 2.0;智谱GLM-5意外泄露;京东正式入局AI支付

    本文汇总了AI领域最新动态:蚂蚁集团开源全模态大模型Ming-flash-omni 2.0,在多模态理解与生成方面表现优异;智谱AI的GLM-5模型引发关注,股价飙升;科大讯飞发布星火X2大模型,基于国产算力深耕专业场景;京东推出“AI付”语音支付产品,提升便捷与安全;DuckDuckGo上线注重隐私的免费AI语音聊天功能;阿维塔车载系统升级,融合大模型与华为智驾;ChatGPT上线保险比价应用,冲击传统中介;OpenAI升级研究工具,引入GPT-5.2驱动并新增全屏报告交互体验。

今日大家都在搜的词: