首页 > 业界 > 关键词  > 开源图像生成模型最新资讯  > 正文

阿里Z-Image登顶开源图像生成模型榜单:1秒生图 千图仅需5美元

2025-12-23 13:51 · 稿源: 快科技

12月23日,阿里巴巴集团发布的技术模型Z-Image Turbo在全球知名基准测试平台的图像生成模型评估中位列榜首。

根据公开的测试数据显示,这款参数规模为6B的模型在综合评分上超越了其他更大参数规模的开源模型,目前已在阿里云平台提供服务,其图像生成成本约为每千张5美元。

测试结果显示,Z-Image Turbo获得了1152的ELO评分,创造了该榜单的新纪录。行业观察人士指出,该模型在性能表现、生成效率及使用成本方面具备显著优势。

阿里Z-Image模型在开源图像生成榜单中取得领先

技术资料显示,该模型支持在配备16GB显存的消费级显卡上运行。在高效能计算环境中,其图像生成响应时间可缩短至约1秒,且输出画质可媲美更大规模的模型。

在生成效果方面,该模型提升了图像的细节还原能力,能够细致呈现皮肤质感、发丝以及各类材质纹理。同时,其对中英文文本的渲染能力进行了强化,即使在复杂版式或小字号场景下,也能保持文字的清晰度与布局的自然感。

在技术架构上,该模型采用了单流扩散Transformer设计,将文本、图像潜变量等条件统一为序列输入,从而提升了参数利用效率。通过解耦式蒸馏与强化学习训练技术,其图像生成所需的推理步骤得以大幅减少,有效提升了生成速度。

此外,模型内置的提示词理解模块能够解析复杂的语义描述。例如,当用户输入古诗词意境时,模型可生成与之匹配的视觉图像。

据了解,该模型于11月下旬面向全球开源,发布当日即在主流开发者社区的热门榜单中位居首位,并持续保持高关注度。截至目前,其下载量已突破400万次。

举报

  • 相关推荐
  • AI日报:MiniMax Music 2.5 发布;蚂蚁灵波开源世界模型LingBot-World;谷歌 Gemini 3.5 泄露

    本期AI日报聚焦多项AI技术突破:MiniMax Music 2.5发布,提升AI音乐可控性与真实度;蚂蚁灵波开源世界模型LingBot-World,为具身智能等提供高保真数字环境;谷歌Gemini 3.5泄露,单次提示可生成三千行代码;Kimi K2.5 Agent升级,高效处理Excel、Word等办公文档;蘑菇物联“灵知”垂直大模型通过备案,专注工业辅助与能源领域;昆仑万维SkyReels-V3开源,实现多模态视频生成;昆仑天工发布音乐大模型Mureka V8,推动AI音乐迈向“可发布”级别;三星宣布下一代AR眼镜将于2026年发布,主打多模态AI体验。

  • 字节跳动即梦AI视频生成模型Seedance2.0怎么用?Seedance 2.0在哪?

    字节跳动旗下即梦平台近日正式上线新一代AI视频生成模型Seedance2.0,凭借多模态参考、高效创作与后期编辑融合等核心突破,成为影视、广告、短视频创作领域的焦点。该模型支持同时上传12个参考文件(图片、视频、音频),可精准复刻运镜逻辑、动作细节与音乐氛围,生成15秒视频仅需约30积分,较前代速度提升超10倍,显著降低废片率。

  • 声网联合美团、xbench 发布 AI 外呼智能体评测基准:VoiceAgentEval

    随着生成式AI在客服领域的快速渗透,AI外呼已从最初的辅助沟通工具进化为企业优化客户沟通、提升运营效率的关键环节,应用场景覆盖招聘、销售、客服等,并成为生成式AI最广泛应用场景之一。同时,随着对话式AI技术的不断成熟,AI外呼正从“能通话”向“会沟通、懂需求”的专家级交互升级。为全面客观评估模型在AI外呼中的综合性能,声网联合美团、xBench共同推出用于评估大模型在AI外呼场景性能表现的综合评测标准VoiceAgentEval,旨在填补行业空白,让从业者更清晰地了解在真实AI外呼业务场景中各个大模型的综合性能表现,并为AI外呼场景的落地与技术体验的优化提供核心参考依据。

  • AI日报:可灵3.0发布;阿里大模型品牌正式更名为千问;Mistral AI 发布 Voxtral Transcribe 2 语音模型

    本期AI日报聚焦多领域进展:可灵AI 3.0发布,开启15秒视频AI导演时代;阿里AI品牌统一为“千问”,战略升级;Mistral AI推出低延迟语音转文字模型;上海AI实验室发布全球最大开源科学多模态模型“书生Intern-S1-Pro”;谷歌Gemini月活用户突破7.5亿,并推出低价订阅方案;华为Mate 80系列新增AI消除屏幕摩尔纹功能;米兰冬奥会将启用阿里“千问”大模型;我国生成式AI用户规模破6亿,普及率超四成,算力水平全球领先。

  • 春节AI牌局,阿里跟注30亿

    互联网习惯了用短期让利换取用户行为迁移的打法,AI也染上了相似的毛病。 2月2日,阿里巴巴旗下千问APP宣布投入30亿启动春节攻势,全面接入淘宝闪购、大麦、飞猪、盒马等生态业务,以免单形式请全国用户在春节期间吃喝玩乐,并将在2月6日上线。

  • 重新定义“实时在线交互”,Soul App开源实时数字人生成模型SoulX-FlashTalk

    Soul AI Lab开源实时数字人生成模型SoulX-FlashTalk,实现0.87秒亚秒级超低延迟、32fps高帧率,支持超长视频稳定生成。该模型具备“零延迟”即时反馈、高精细度全身动作合成、超长视频稳定生成等亮点,通过双向蒸馏与多步回溯自校正机制解决传统方案延迟高、画面不一致等问题。在电商直播、短视频制作、AI客服等场景提供高质量、可落地的解决方案,推动大参数量实时生成式数字人迈入具体商用阶段。

  • AI日报:腾讯混元图像3.0正式开源;Clawdbot迫于压力更名Moltbot;月之暗面发布 Kimi Code

    本期AI日报聚焦多领域AI新动态:腾讯混元图像3.0开源,成为全球最强开源图生图模型;月之暗面发布Kimi Code,推动国产AI编程工具进入新阶段;开源项目Clawdbot因商标风险更名Moltbot,并遭诈骗者利用旧账号发布虚假代币;谷歌AI Plus计划正式扩展至美国等35个市场,月费不足8美元;OpenAI发布基于GPT-5.2的科研协作平台Prism;谷歌Aluminum OS界面首曝,深度融合Android与ChromeOS;Mistral AI发布终端编程助手Vibe 2.0,步入“子代理”时代;小米AI眼镜深度集成支付宝,实现停车缴费与健康管理“无感交互”。

  • 不同AI模型对同一品牌的推荐差异大吗?用跨平台检测看清GEO推广盲区

    品牌在海外社媒投放GEO定向广告时,常因不同平台AI推荐模型对地域适配逻辑的差异,导致曝光效果不及预期。例如,同一内容在Instagram Reels和YouTube Shorts的本地推荐率可相差近一倍。这种差异源于各平台判定“地域相关性”的标准不同,可能依赖IP定位、用户行为或社交关系链。若仅凭单一平台数据优化,易陷入“推广盲区”,甚至因模型偏差产生“伪精准”投放,即广告看似投给目标用户,实则被游客或虚拟定位用户消耗预算。跨平台GEO效果检测工具(如Aibase的GEO Checker)能同步模拟多地区、多设备环境下的内容曝光路径,直观呈现差异,帮助品牌快速定位渠道盲区,并提供优化建议,如调整素材中的文化符号或切换更适合该地域的平台组合,从而提升真实本地转化率。

  • 实时生成开放世界:新AI模型贴脸开大,游戏研发慌不慌?

    这两天,又有一款全新的AI模型出现了。 虽说如今AI改变各行各业的事情早就屡见不鲜,在游戏业,很多岗位也或多或少已经用上了AI技术,但最近发布的这款AI模型,它真不一样。 这款AI模型名叫PixVerse R1,按官方说法,PixVerse R1是全球首个真正意义上的「实时生成世界模型(Real-time World Model)」。

  • 范式官宣2026战略升维:以“AI Agent + 世界模型”为核 构建“AI + X”产业新生态

    1月30日,范式集团年会在北京举行。创始人戴文渊正式宣布,集团已完成品牌体系与战略架构的全面升级。范式确立了以“AI Agent + 世界模型”为核心的技术路线,开启“AI + X”的产业新生态。自2014年成立以来,范式坚持“AI for Everyone”的使命,始终致力于将AI的红利惠及每一个人,在金融、制造、能源等20多个领域积累了十多年的经验。2025年,公司完成集团化转型,在延续“

今日大家都在搜的词: