首页 > AI头条  > 正文

阿里通义实验室再出王炸!Z-Image-Turbo-Fun-Controlnet-Union 开源,6B 参数秒杀 Flux

2025-12-03 08:54 · 来源: AIbase基地

2阿里巴巴通义实验室今日正式开源 Z-Image-Turbo-Fun-Controlnet-Union,这款全新 ControlNet 模型标志着其 Z-Image 系列图像生成生态的重大扩展。作为 AIbase 独家追踪的开源 AI 动态,此次发布进一步强化了 Z-Image-Turbo 在精确控制与创意生成方面的领先优势,迅速引发全球开发者与创作者的热议。

image.png

模型已在 Hugging Face 平台上线,支持 Apache2.0许可,适用于商用场景。发布背景与技术基础Z-Image 系列自11月底首发以来,已迅速登顶 Hugging Face 趋势榜,首日下载量突破50万次。

该系列以单流扩散架构为核心,仅6亿参数却实现照片级真实感渲染,包括皮肤纹理、发丝细节及光影美学优化。Z-Image-Turbo 作为快速推理版本,仅需8步采样即可生成1024x1024分辨率图像,推理时间低至9秒(RTX4080硬件),并在提示词理解上支持中英混合文本渲染,显著提升了创作效率。

image.png

 此次 Z-Image-Turbo-Fun-Controlnet-Union 的推出,是对 Z-Image-Turbo 的深度扩展。它在模型的6个核心块上集成 ControlNet 结构,兼容 Canny 边缘检测、HED 边界提取及 Depth 深度映射等多模态控制条件。该模型专为复杂场景设计,如人物姿态精确生成及基于线稿的建筑渲染,目前通过 Python 代码实现集成,ComfyUI 等工作流支持即将跟进。

核心功能与应用亮点

  • 多条件控制融合:支持姿态、边缘与深度信息的联合输入,实现“零失真”图像操控。开发者可轻松构建从草图到成品的自动化管道,适用于电商视觉设计、影视特效及游戏原型制作。
  • 高效兼容性:继承 Z-Image-Turbo 的轻量架构,仅需6GB VRAM 即可运行,远低于传统 ControlNet 模型的硬件门槛。测试显示,在低端 GPU 上生成速度达250秒/5步,平衡了质量与实时性。
  • 开源生态赋能:模型提供4-bit 量化版本(如 MFLUX 兼容),便于 Mac 等消费级设备部署。同时,Z-Image-Edit 变体增强了复合编辑指令理解,保持画面一致性。

这些功能不仅降低了 AI 图像生成的门槛,还为非专业用户打开了专业级创作大门。社区反馈显示,该模型在广告素材生成中,提示词忠实度超越 OVIS Image 等竞品。 

社区反响与未来展望开源社区对 Z-Image-Turbo-Fun-Controlnet-Union 的响应热烈,Reddit 与 X 平台上涌现大量基准测试,包括名人面部识别及 K-pop 偶像生成实验,结果显示其在辨识度与自然度上表现出色。开发者赞誉其“按着 Flux 打”的效率优势,尤其在低 CFG Scale(2-3)下的稳定输出。 AIbase 分析,此次发布强化了阿里巴巴在开源 AI 领域的全球竞争力。

未来,预计将与 Z-Image-Base 版本联动,形成完整图像生成-编辑-控制闭环。

 Hugging Face :https://huggingface.co/alibaba-pai/Z-Image-Turbo-Fun-Controlnet-Union

  • 相关推荐
  • AI日报:Kling 2.6将发布;千问APP推学习大模型;Z-Image-Turbo-Fun-Controlnet-Union 开源

    本期AI日报聚焦多领域AI进展:Kling 2.6发布,支持音频同步生成,AI视频进入有声时代;千问APP推出学习大模型,提升拍照答疑与作业批改能力;阿里通义实验室开源图像生成模型,实现精准控制;豆包手机助手遭遇微信登录异常,凸显生态兼容挑战;米哈游推出带猫语特色的AI聊天模型AnuNeko;亚马逊云科技发布三款新型AI智能体,其中Kiro可自主编程数日;IDC报告预测具身智能�

  • AI日报:OpenAI推图片模型GPT Image 1.5;腾讯发布混元世界模型1.5;小米开源MiMo-V2-Flash大模型

    本期AI日报聚焦多领域AI新进展:OpenAI推出图像生成模型GPT Image 1.5,性能显著提升;腾讯发布混元世界模型1.5,开启实时交互虚拟世界;小米开源3090亿参数大模型MiMo-V2-Flash,推理速度领先;字节跳动发布Seedance 1.5 Pro,实现视听同步创作;Apple Music将与ChatGPT集成,简化歌单创建;Gemini预测市场全美上线,支持事件预测交易;Adobe Firefly视频功能升级,支持精准提示编辑;谷歌实验室推出AI助手CC,集成Gemini技术管理日程。

  • 一加Turbo系列官宣:全面继承旗舰机型性能基因

    一加中国区总裁李杰透露,即将推出的一加Turbo系列将全面继承旗舰机型的强悍性能基因,在续航方面引领同档产品,达到最强水准。该系列还将提供超乎同价位段前所未有的游戏体验,让用户以更亲民价格享受顶级游戏乐趣。新机将搭载骁龙8s Gen4特调版芯片,支持165Hz高刷新率,电池容量有望达到9000mAh级别,彻底摆脱电量焦虑。一加对Turbo系列充满信心,认为其将成为同档产品中性能、续航及游戏体验都“强得可怕”的存在。

  • IBM宣布收购Confluent,构建面向企业级生成式AI的智能数据平台

    IBM宣布以约110亿美元现金收购数据流处理公司Confluent,旨在为企业客户提供端到端数据平台,连接、处理并治理AI应用和智能体使用的数据。交易预计于2026年完成,将提升IBM的调整后息税折旧摊销前利润,并在第二年增加自由现金流。Confluent基于Apache Kafka构建,其实时数据流处理能力与IBM的AI基础设施软件结合,将助力企业更快速部署生成式AI和AI智能体,消除数据孤岛,抓住数据爆炸与AI普及带来的市场机遇。

  • AI日报:阿里万相2.6支持角色扮演;ChatGPT 新增分支聊天功能;快手Agentic Coding模型杀入全球榜前十

    本期AI日报聚焦多项AI领域新动态:阿里发布通义万相2.6,支持角色扮演与多分镜控制,视频生成能力提升;快手KAT-Coder-Pro V1模型进入全球AI榜单前十,展现强大编程性能;ChatGPT新增分支聊天功能,支持多线程对话,提升互动效率;谷歌搜索测试“+”按钮,允许上传文件并用Gemini AI深度分析;阿里推出免费AI企业查询App“88查”,整合AI技术提升信息查询效率;Canva在中国市场推出对话式AI助手,简化设计流程;机器人开发平台Tnkr上线,整合硬件、软件与AI模型,打造开源生态;IBM发布开源AI助手CUGA,任务自动化完成率超六成,旨在提升企业工作效率。

  • 轻松实现PC级体验 三星Galaxy Z TriFold是你手中的便携式工作站

    三星Galaxy Z TriFold作为旗下首款三折叠手机,凭借10英寸超大屏幕和本地独立运行的Samsung DeX模式,实现了移动生产力的跃升。它打破了传统折叠手机多任务处理的局限,支持最多四个独立桌面,每个桌面可同时运行五个应用窗口,并允许自由拖拽文本、图片,操作如同PC。配合蓝牙键鼠,用户能高效处理文档编辑、数据管理等复杂任务。该机还可外接显示器,实现双屏协同办公。Galaxy Z TriFold构建了完整的移动办公解决方案,让用户外出时无需携带平板或笔记本,一部手机即可满足大部分工作需求。

  • REDMI Turbo 5 Pro最快春节前亮相:首次搭载天玑9系芯片

    从今年开始,Redmi K系列升档为 冠军旗舰”,Turbo系列接棒K系列成为REDMI 2000-3000元价位的主力机型。 至此,Redmi构建起以Turbo系列(性能旗舰)、K系列(全能旗舰)、Note系列、数字系列为核心的四大产品线矩阵,实现对全价位段的全面覆盖。 目前K90系列已经上市,接下来要登场的就是Turbo系列REDMI Turbo 5,这次REDMI将会同时推出Turbo 5和Turbo 5 Pro两款机型。 该系列已经获得3C认�

  • MacBook Pro首次采用OLED:Mini LED时代将终结

    2012年苹果推出了首款Retina视网膜显示屏MacBook Pro,在720P当道的时代可以说惊艳四座。 2021年,首款配备Mini LED显示屏的MacBook Pro亮相,苹果自信地称之为世界上最好的笔记本屏幕”。 时隔5年,苹果笔记本屏幕再度升级,明年的MacBook Pro系列将首次搭载OLED屏,Mini LED将被淘汰。 虽然Mini LED比传统LCD显示更优,但是Mini LED仍然依赖背光模组,而且没有彻底摆脱LCD屏色域窄的问题。

  • 真我16 Pro系列官宣:全球首发LumaColor影像技术

    真我宣布与莱茵TV合作建立LumaColor影像实验室,即将登场的真我16 Pro系列将全球首发LumaColor影像技术。 真我介绍,LumaColor影像技术由真我和莱茵TV联合研发,基于这项先进的影像技术,真我16 Pro系列将带来标杆级的人像拍摄体验,能拍出肤色自然、光影层次分明、氛围感十足的人像作品,让画面更具真实感与情感张力。 具体来看,LumaColor采用了行业首创的光色协同处理方案,

  • 苹果iMac Pro有望回归 顶配将搭载M5 Max芯片

    苹果计划在2026年上半年推出其M5系列芯片的高性能型号,包括M5 Pro、M5 Max和M5 Ultra。 其中,顶级的M5 Ultra芯片有望搭载于新一代Mac Studio,使其成为苹果性能最强大的桌面设备。 同时,泄露的iOS 26内部代码显示,苹果正在开发一款代号为J833c”的iMac,其搭载的H17C平台被推测为M5 Max芯片。这意味着苹果可能正在测试搭载M5 Max的新款iMac Pro机型。

今日大家都在搜的词: