首页 > 业界 > 关键词  > Kolors最新资讯  > 正文

国产AI大模型Kolors:ComfyUI平台部署指南

2024-07-16 15:06 · 稿源:站长素材

在AI技术的浪潮中,快手公司推出的文生图大模型——Kolors,以其卓越的性能和开源精神,成为国产AI技术的一颗璀璨新星。Kolors不仅在图像生成效果上超越了现有的开源模型,更达到了与商业闭源模型相媲美的水平,迅速在社交媒体上引发热议。

image.png

Kolors的开源之路

Kolors的开源不仅仅是一个技术里程碑,更是快手对AI技术开放态度的体现。在世界人工智能大会上,快手宣布Kolors正式开源,提供了包括模型权重、完整代码和技术报告在内的全面资源,目前已在Huggingface平台和GitHub上线,供全球开发者免费使用。

并且在github主页上表示了开源计划,模具已经开源了接口和大模型,后续会开源出kolors的Lora,controlnet等等,着实让人期待。

image.png

Kolors的卓越性能

Kolors以其强大的复杂语义理解能力和摄影级的画质质感,赢得了开发者和用户的高度评价。在智源FlagEval文生图模型评测中,Kolors以75.23分的主观综合评分排名全球第二,尤其在图像质量方面表现突出,评分排名第一

image.png

Kolors的技术创新

Kolors采用了隐空间扩散模型,并结合大语言模型进行文本表征,使其具备了复杂长文本理解能力。通过两阶段渐进训练策略,Kolors在图像美感和质量上达到了国际领先水平。此外,Kolors还是首个原生支持中文文字生成的文生图模型,展现了其在理解和呈现中国特色元素方面的优势。

image.png

Kolors的ComfyUI部署

以上介绍这么多,大家肯定已经跃跃欲试了。现在教大家如何在本地部署Kolors。

在github上已经有了Kolors的一键部署

github首页:https://github.com/kijai/ComfyUI-KwaiKolorsWrapper

huggingface首页:https://huggingface.co/Kwai-Kolors/Kolors

首先我们复制项目的url

image.png

复制后我们到comfyui管理器安装,安装完成后重启

image.png

然后我们搭建出一个最简单的Kolors文生图工作流

image.png

搭建完成后我们点击添加提示词队列就会帮我们自动下载所需的大模型和文本编码

⚠️注意:由于模型都是从huggingface上下载,大模型大概5G,文本编码器大约11G,所以请使用科学上网保持网络畅通。

最后模型会下载到该文件路径下:

安装报错解决

我们第一次下载使用是可能会遇到 文本编码器找不到文件报错

image.png

解决的办法也很简单,我们到huggingface的项目地址,在text_encoder文件中下载所有的json和python文件,

image.png

并放入我们本地的text_encoder文件夹中,由于下载下来的文件命名不对,所以我们还要重命名,对应下图命名即可

image.png

最后我们还要下载Vae模型,并放入下图的文件路径内

image.png

本地vae文件路径

image.png

以上问题解决后我们就可以使用Korols生图了,在我们刚刚的工作流中使用中午提示词生图真的很舒服,而且画面质量也很精美,手部也没有出现太大问题。在抽象图片上也有很好的效果不输Midjouney。

image.png

image.png

Kolors与开源社区的未来

在Stability AI经历动荡之际,快手的Kolors开源成为了开源社区的新焦点。快手计划陆续开源Kolors的相关应用组件,丰富其开源生态,并期待与全球开发者共同推动文生图大模型社区的发展。

总结

快手的Kolors大模型以其开放的态度、高标准的技术和实际的商业应用,展现了国产AI技术的真正实力。在AI技术不断演进的今天,Kolors的开源和落地让我们看到了技术与内容形态结合的无限可能。随着越来越多的企业和开发者加入Kolors的开源生态,我们有理由相信,这将为整个行业带来新的发展机遇。

------------------------------------------------------------------------------------------

站长素材AI教程是站长之家旗下AI绘图教程平台

海量AI免费教程,持续更新干货内容

想要深入学习更多AI绘图教程,请访问站长素材AI教程网:

https://aisc.chinaz.com/jiaocheng/

举报

  • 相关推荐
  • ColorOS陈希评iOS 26:缺席的AI是最大短板

    ColorOS设计总监陈希发文指出,iOS 26的最大短板依然是缺席的AI,但UI设计更新较大。 此前在去年的WWDC开发者大会上,苹果大肆宣传Apple Intelligence,不过从后续iOS 18的一系列更新来看,苹果在AI方面的表现并不成功,尤其是国行版,进度缓慢。 因此,在今年的WWDC大会上,关于AI的升级内容并不算很多,苹果软件工程高级副总Craig Federighi承认,Siri的AI功能短期内不会推出,因为�

  • 国内有哪些ai大模型?一文看懂中国核心AI大模型全景

    近两年中国AI大模型发展迅猛,已形成"通用+行业"双轨并进的生态格局。百度文心一言、阿里通义千问等通用大模型在中文理解、多模态生成等方面表现突出;深度求索DeepSeek以1/10参数实现GPT-4级推理能力;月之暗面Kimi以20万汉字上下文窗口领跑长文本处理;智谱AI的GLM-4成为首个支持视频对话的国产千亿模型。医疗、金融等垂直领域涌现出百川智能等专业模型,覆盖超1000家医院。开源生态加速国产芯片适配,15家厂商完成深度优化。行业应用方面,工程文档效率提升60%,24小时拟人化客服等案例凸显价值。未来趋势呈现模型蒸馏、端侧部署和开源生态三大方向,中国AI正从实验室走向产业变革前沿。

  • 玄武云出席崔牛会AI活动,聊聊AI大模型如何掌握终端信息

    6月20日,崔牛会主办的AI发现者计划之AI+OPEN DAY在广州举办,玄武云与百度云等企业围绕AI大模型应用展开探讨。玄武云分享了快消行业数字化转型解决方案,推出SKU超级模型和价签识别模型,帮助品牌商提升终端管理效率。其中SKU模型覆盖6000+商品,识别准确率达90%;价签模型准确率85%,已应用于知名薯片品牌。通过AI技术实现商品陈列优化、价格监控和渠道布局分析,助力快消企业从经验驱动转向数据智能驱动,在存量市场中创造增量价值。

  • 主流AI多模态大模型有哪些?超全的多模态大模型指南分享

    2024年多模态大模型成为AI领域最具前景的技术方向之一。文章全面分析了主流多模态大模型的特点、应用场景和发展趋势。多模态大模型能同时处理文本、图像、音频、视频等多种数据,实现更智能的人机交互。重点介绍了GPT-4V、Claude3.5、Gemini、通义千问等代表性模型,对比了它们在视觉理解、编程能力、中文处理等方面的优势。应用场景涵盖智能客服、内容创作、教育医疗等领域。未来发展趋势包括模型规模扩大、支持更多模态、实时交互能力提升等。选择模型需考虑应用需求、语言支持、性能成本等因素。

  • 2025最新全球AI大模型排名,国内外模型动态洗牌(实时更新平台推荐)

    2025年全球AI大模型竞争进入白热化阶段,OpenAI、Google等国际巨头与中国企业激烈交锋。技术迭代远超预期,仅半年内排名就经历多次洗牌。当前全球AI大模型综合排名Top10显示:1)GPT-4.5综合80.4分领跑;2)Claude3.7编程领域领先;3)Gemini2.0多模态标杆;4)国产DeepSeek R1推理速度提升3倍;5)阿里Qwen2.5数学编程单项第一。中国模型通过开源策略、垂直优化和成本革命实现弯道超车,如DeepSeek R1仅耗资600万美元达到GPT-4水平,字节豆包采用稀疏MoE架构成本大幅降低。中文场景深度优化表现突出,如文心一言4.0方言交互准确率92%。开源生态爆发,通义千问全尺寸开源(7B~110B参数)在Hugging Face排名第一。权威评估需结合标准化测试、人类盲测和场景适配性。

  • 7款AI大模型写高考作文,语文名师点评,豆包、GPT等斩获前三

    刚刚, 2025 年高考作文题目出炉,再次成为亿万网友关注的话题。越来越“聪明”的人工智能大模型写高考作文真题,会带给我们怎样的惊喜?阅卷老师又会给出怎样的分数呢?今年湖北高考语文采用全国一卷,作文题为根据给定的材料进行写作。根据阅卷老师的打分,豆包、通义千问、GPT-4o的作品斩获前三名。全国一卷阅读下面的材料,根据要求写作。( 60 分)他想要给孩子们唱

  • 纳米 AI 融合仓颉登陆鸿蒙,为国产AI搜索筑牢自主根基

    近日,纳米 AI 搜索与华为达成重磅合作,纳米AI的移动App正式入驻鸿蒙 HarmonyOS5 生态,实现移动端与桌面端设备的全场景流畅运行。

  • 2025年高考数学新一卷上热搜:6个AI大模型宣布挑战 谁更强?

    近日,随着高考的落幕,一场别样的“高考”也在各大AI大模型之间展开。此次测试邀请了多家知名科技公司的大模型,参与2025年数学新课标Ⅰ卷中的14道客观题测试,以此检验它们在逻辑推理和数学能力上的表现。测试题目包括8道单选题、3道多选题和3道填空题,满分73分,测试过程严格遵循高考判分原则。 测试结果显示,字节跳动的豆包和腾讯的元宝(T1)以68分的总成绩�

  • @开发者们:百度文心大模型4.5系列模型开源,国内首发平台GitCode现已开放下载!

    6月30日,百度文心大模型4.5系列正式开源并在国内领先的开源平台GitCode首发上线。该系列包含10款模型,涵盖47B和3B参数的混合专家(MoE)模型及0.3B的稠密参数模型,采用创新的多模态异架构结构实现跨模态知识融合。模型基于飞桨框架开发,训练效率达47% MFU,在文本和多模态基准测试中达到SOTA水平。所有模型按Apache2.0协议开源,配套产业级开发套件支持多种芯片部署。GitCode平台已汇聚620万用户,为AI开发者提供代码托管、协同开发等全流程支持。此次开源将推动中国AI生态创新,加速大模型技术产业化应用。

  • 6个AI大模型大战2025年高考数学新一卷:数学题推理能力均显著提升

    ​近日,随着高考的圆满结束,一场别开生面的“数学擂台赛”在各大AI大模型间悄然展开。多家知名科技公司的大模型被邀请参与2025年数学新课标Ⅰ卷中的14道客观题测试,以此检验它们在逻辑推理和数学能力上的实力。此次测试题目包含8道单选题、3道多选题以及3道填空题,满分设定为73分,且测试过程严格遵循高考判分原则,确保结果的公正性与准确性。 测试成绩揭晓�