再见设计师！COLE AI系统利用多模型联合生成高质量设计

2023-12-01 10:35 · 稿源：站长之家

划重点:
1. 🤯 COLE是由微软亚洲研究院和北京大学的12名研究人员开发的，结合了Meta的Llama2-13B、DeepFloyd IF、LLaVA1.5-13B和GPT-4V等多个AI模型，以及开源图形渲染器Skia。该系统旨在通过用户输入设计项目概念，生成图像并嵌入相关文本，具备可编辑文本和视觉元素的功能。
2. 🌐 COLE采用了不同AI模型的组合，通过对互联网上的10万张高质量原始图形设计图像进行训练，实现了出色的设计生成效果。
3. 🖌️ COLE不仅生成图像，而且提供了可编辑的文本和对象区块，使用户能够在COLE框架内直接进行修改，而无需导出到其他设计软件

站长之家（ChinaZ.com）12月1日消息:近日，微软亚洲研究院和北京大学的研究人员联手开发了一款名为COLE的AI系统，旨在通过多个AI模型的联合工作，为用户提供可编辑的图形设计。COLE的名字来源于亨利·科尔，他被认为是1843年第一张图形化圣诞卡的创作者。

论文网址：https://arxiv.org/pdf/2311.16974.pdf

这一系统的独特之处在于，它不仅可以生成图像，还能够嵌入相关文本，使用户能够通过输入设计项目的概念，如“一张宣传即将举行的冬季假期音乐会的海报，上面有穿着暖和衣物的人在落雪中演奏乐器”，即可获得一张完整的设计。

COLE的背后是一组不同的AI模型，包括Meta的Llama2-13B、DeepFloyd IF、LLaVA1.5-13B以及GPT-4V，以及开源图形渲染器Skia。这些模型的组合是为了应对图形设计的复杂性以及在该领域主要格式（.SVG文件）上缺乏可用的训练数据。

与其它文本到图像生成器相比，如OpenAI的DALL-E3和Midjourney，COLE在设计生成方面取得了令人瞩目的效果。通过对互联网上10万张高质量原始图形设计图像的训练，COLE不仅能够生成清晰有序的图形设计，而且能够在图像内生成可编辑的文本和对象区块。

更值得一提的是，COLE生成的图像可在其框架内进行直接编辑，用户可以点击文本框更改显示的文本或字体，也可以输入新的提示以更改图像的不同视觉元素。这为用户提供了一种便捷的方式，避免了回到设计的起点进行整体修改或将图像导出到其他设计软件的繁琐步骤。

虽然COLE目前更像是一个框架而不是一个成熟的产品，但其研究团队在图形设计服务方面取得的结果令人惊叹。研究人员表示，COLE不仅在生成各种设计项目时表现出色，而且在可编辑性和灵活的编辑空间方面也达到了预期目标。

对于图形设计行业而言，COLE到底是威胁还是新工具呢?研究人员强调，他们设计COLE是为了生成具有可编辑字段的图像，以“在必要时允许用户进一步完善输出，整合人类专业知识”。这意味着图形设计的专业培训仍然对于从COLE框架中获得最佳结果是必要的。

然而，研究人员也指出，相比于其他文本到图像生成器，如他们明确引用的DALL-E3，“我们的COLE系统…能够在只需要简单用户意图的情况下生成优质的图形设计图像。”这表明，研究人员认为COLE有可能让那些没有图形设计培训或专业知识的人能够生成与专业设计师媲美的高质量设计。

尽管目前COLE尚未公开提供，但研究人员表示他们的Github项目网页上将很快发布演示版本，使更多人能够了解和体验这一引人注目的图形设计生成框架。

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
Diffusion-RWKV官网体验入口 AI生成高质量图像工具使用地址

Diffusion-RWKV是一种基于RWKV架构的扩散模型，旨在提高扩散模型的可扩展性。它针对图像生成任务进行了相应的优化和改进，可以生成高质量的图像。欲了解更多详细信息并开始使用Diffusion-RWKV，请访问Diffusion-RWKV官方网站。

Diffusion-RWKV
Parler-TTS：一个高质量文本到语音（TTS）模型

一个名为Parler-TTS的全新开源项目引起了业界的广泛关注。Parler-TTS是一个高质量的文本到语音模型，它能够生成听起来非常自然的语音，为用户提供了前所未有的语音合成体验。项目团队还提供了交互式的演示和详细的训练指南，帮助用户快速上手并根据自己的需求对模型进行定制。

语音模型 Parler-TTS AI头条
聚焦绿色低碳高质量发展，中成空间这样答题

在数字化转型与绿色发展的时代背景下，全球经济深入发展，产业结构持续升级，新质生产力的培育和发展已成为推动经济社会高质量发展的核心动力。作为行业科技创新的领跑者，中成空间打造“气膜”特色品牌，气膜产品凭借其领先的科研技术、创新实践和环保理念，为新质生产力的发展注入强大动力，为港口码头、矿产原采、文体科技、商旅文化等领域的转型升级和高质量发展增添创新动能。中成空间将持续发挥其在新质生产力发展中的重要作用，助力各行业迈向更高层次的转型升级和高质量发展，同时也为构建更绿色、智能、高效的产业生态贡献企业力量。
天九共享助推托育服务高质量发展为家庭提供更好的服务

育儿难题和养老服务需求日益凸显。越来越多的年轻人在结婚生娃后或多或少都会遇到育儿难题，一是因为没有经验，二是很多双职工家庭没人带娃，此外还存在年轻人与长辈教育观念有一定矛盾分歧等问题，这使得高质量的托育服务供不应求。天九共享集团作为享誉中外的创新企业加速平台，积极借助平台资源和能力，持续助力托育养老行业创新和加速增长，推动托育养老服务优质发展，为儿童和家庭提供更好的服务，同时也为行业发展注入新的活力。

育儿难题养老服务托育服务
科技加码，长生人寿向高质量发展之路挺进！

近些年，长生人寿聚焦数年所积累的线下优势持续发力，将保护消费者权益作为一切工作的出发点、立足点和根本点，把“以用户为中心”的服务理念转化成改进管理、优化服务、诚信展业的实际行动，形成线上线下一体、前后端完美联动、实时智能的服务形式，助推公司快速发展，促推保险惠及更广泛的人群。全面互联，搭建数字化平台长生人寿将物联网技术应用到线下服�

长生人寿消费者权益服务理念
联纲光电加大研发技术投入打造高质量产品服务

近年来，我国的制造业转型势头强劲，高技术含量、高附加值的高新技术制造企业保持较快增长，不断助推我国制造业加速升级。联纲光电科技股份有限公司深耕光电信号传输领域16年，现旗下拥有6家子公司以及东莞总部生产基地、江西赣州生产基地、广西南宁生产基地、越南北宁生产基地，供应链资源遍布全球，现已荣获国家高新技术企业、国家级专精特新小巨人企业等称�

制造业升级高新技术制造光电传输
告别不合格涂料产品三棵树以创新研发为驱动打造高质量产品

目前我国已有超过20万个老旧小区完成改造，涉及近1亿人口，推动了内外墙翻新的需求。去年，24.7%的消费者选择翻新自住房，体现了居住品质升级的趋势。然而，如果在选择涂装产品时不够谨慎，买到了不合格产品，就可能会在翻新涂装环节踩坑。作为国内的健康漆领军品牌，三棵树致力于通过创新研发打造高质量涂料产品，让更多消费者在选择时告别不合格产品，避免踩坑

老旧小区改造内外墙翻新涂装产品选择
Cohere推出大模型Command R+ 优化高级检索增强生成功能

Cohere推出了专为企业级工作负载设计的大型语言模型CommandR，该模型优化了高级检索增强生成功能，以减少错误生成，并支持10种关键语言的多语言覆盖。地址:https://dashboard.cohere.com/CommandR引入了多步骤工具使用功能，允许模型在多个步骤中结合多种工具来完成困难的任务。CommandR首先在MicrosoftAzure上提供，未来也将在OracleCloudInfrastructure以及其他云平台上提供，以满足更广泛的用

Command AI头条
Ctrl-Adapter：专为视频生成设计的Controlnet 提供有效精细控制

Ctrl-Adapter是一个专门为视频生成设计的Controlnet，旨在为各种图像和视频扩散模型提供丰富的控制功能，并优化视频的时间对齐。这个工具的开发是为了增强现有的图像和视频生成技术，使其能够更好地满足用户的特定需求。随着技术的不断进步，我们可以期待Ctrl-Adapter在未来将有更多的应用场景和进一步的发展。

Ctrl-Adapter AI头条
Align Your Steps：低步数推理保持高质量结果适用于SD 1.5和SDXL

在深度学习领域，扩散模型作为生成建模的前沿方法已经得到广泛应用。DMs的一个关键缺点是其较慢的采样速度，这主要是由于需要通过大型神经网络进行多次顺序函数评估。在视频生成方面进行了研究，发现使用优化计划可以在视频生成过程中产生更加稳定的视频，减少随时间推移的颜色失真。

AlignYourSteps AI头条

Dreamseer:是一款将数据科学与艺术相结合的平台，通过解读梦境来理解自我和世界。

Dreamseer是一款APP，通过数据科学解读梦境，帮助用户深入了解自己，并实现个人成长和进化。它的主要优点包括提供深入洞察力、推动社区协作、扩展梦境世界等。Dreamseer定位于个人成长和社区合作的领域。

梦境数据科学个人成长

Herodot AI:Herodot是一款AI旅游助手，为你提供关于地图上任何对象的精彩故事。

Herodot是一款AI旅游助手，通过讲述有趣的故事来为用户提供关于地图上任何对象的信息。它使用人工智能技术，可以为用户提供丰富的历史和文化知识，并帮助规划旅行行程。Herodot的主要优点是提供个性化的旅行指南和故事，让用户更好地了解目的地的背景和文化。

旅游历史文化

MarketerGrad by Pangea:匹配高质量的营销人员和设计师，帮助您快速增长。由Pangea AI提供支持。

MarketerGrad是一个提供高质量的营销人员和设计师的平台，通过匹配具有2到10年经验的人才来帮助您快速增长。该平台由Pangea AI提供支持，具有灵活的合同结构，使您能够更快地招聘到合适的人才。

营销设计招聘

Edubrain AI Homework Helper:Edubrain是一个AI作业助手，可以为学生提供个性化解决方案，帮助他们更好地完成作业并节省时间。

Edubrain是一个AI作业助手，通过提供可靠的解决方案来帮助学生解决作业问题。它可以为任何学科和学术水平提供个性化的解答。Edubrain具有无限制的使用次数，完全免费，可以在10秒内生成可靠的答案。

作业助手学习工具教育技术

Learn, Build & Ship SaaS with ShipGPT:构建和交付AI的Next.js模板和教程

SHIPGPT是一个前后端完整的AI模板，提供了各种AI用例的脚手架，使您能够构建自己的AI应用程序或将AI集成到现有技术中，无需雇佣全栈开发人员和AI开发包装器。

AI SaaS 模板

https:创建你的 ComfyUI 工作流程应用，并与他人分享

ComfyFlow 是一个基于 ComfyUI 的工作流程应用创建平台，能够快速创建工作流程应用并与他人分享。它使用稳定扩散（Stable Diffusion）和 ComfyUI 技术构建，具有简单易用、完全托管、免费使用等优点。

ComfyFlow ComfyUI 工作流程应用

AI Experts Top:AI Experts是一家专注于数字营销的AI顾问机构，致力于将人工智能技术应用于业务中，帮助企业提高效率和推动增长。

AI Experts是一家专注于数字营销的AI顾问机构，通过AI驱动的工具，帮助企业高效地生产高质量的内容，并通过数据分析提供有价值的见解，引导业务策略。AI Experts的主要优点包括节省时间和资源、提高内容质量、提供数据驱动的决策支持等。产品背景信息：AI Experts是由真人运营的AI机构，致力于帮助企业将人工智能技术应用于业务中。

AI 数字营销内容生产

Pongo:是一个语义过滤器，使用1行代码可以将RAG工作流中的LLM幻觉减少80%。

Pongo的语义过滤器可以通过一行代码将RAG工作流中的LLM幻觉减少80%。它利用多种先进的语义相似性模型和专有的排名算法，确保您始终获得正确的信息。Pongo可以与现有的流程集成，并提供快速的响应时间和零数据保留。

语义过滤器 RAG工作流语义相似性

Video To Tweet:将YouTube视频转换为推特/博客内容

Video To Tweet是一个将YouTube视频转换为推特和博客内容的工具。它能够将视频转换成有吸引力的推特和详细的博客文章，帮助您轻松提升在线存在感。通过尝试使用我们的工具，优化您的内容策略，扩大触达更广泛的受众。

社交媒体内容创作数字营销

TextToVideo.Bot:将文本转化为令人惊叹的视频。

TextToVideo是一个AI驱动的工具，可以将文本转化为令人惊叹的视频。它可以帮助用户快速创建YouTube、Instagram和TikTok等平台上的内容，无需等待或支付过高的费用。它提供快速、经济实惠的视频制作解决方案，帮助用户讲述故事，提升品牌影响力。

视频创作工具 AI

Email Generator AI Tool:Email Generator AI工具是一款帮助您高效撰写电子邮件的人工智能工具。

Email Generator AI工具可以帮助您快速、高效地生成电子邮件内容，节省您的时间和精力。

生产力工具电子邮件

MentorAI:通过，你可以向马库斯·奥勒留提问和描述生活中的问题和情况，他将提供个人指导和斯多葛哲学的建议作为回应。

MentorAI允许您提问并描述生活中的问题和情况，马库斯·奥勒留将以个人指导和斯多葛哲学的建议作为回应。它提供了与一位哲学家国王的互动体验，帮助您在生活中面对挑战时获得智慧和指导。

智慧指导哲学

TravAI:是一款AI驱动的旅行培训产品，提供交互式AI培训、模拟、评估和智能助手，为旅行行业人员提供最新的技能和知识。

TravAI是一款旅行行业的AI驱动培训产品，通过注入AI技术，为培训注入活力。它能创建引人入胜、交互式的培训课程，进行逼真的角色扮演模拟，并设计能够真正起作用的测验。同时，TravAI利用您的数据为旅行团队量身定制个性化学习体验，让培训不再是通用的、一刀切的。它是培训旅行业专业人员的更智能、更快速的方式。

旅行培训 AI

Nextminds:是一家提供在线辅导服务的平台，为所有科目和学术水平的学生提供个性化辅导。

Nextminds是一个提供在线辅导服务的平台，通过与经验丰富的导师在线互动，为学生提供个性化的学习经验。平台提供ICSE、CBSE和州委员会等多种教育体系的辅导。Nextminds的主要优点是学生可以在舒适的家中与专业的导师进行一对一的在线学习，为学生提供高质量的辅导服务。

在线辅导学习个性化

Pedagogue.io:每天花费10分钟，提升您的AI技能。

Pedagogue是一款AI技能培训平台，旨在帮助个人和企业提升AI技能。通过该平台，用户可以学习AI工具、技术和策略，并获得40%的生产力提升。Pedagogue的优势在于更新及时的内容库、个性化的技能培养、有趣的学习方式以及具有商业价值的数据驱动洞察。

AI 技能培训教育

LexiGym:你的语言学习伴侣。🚀 # #HinkouLabs

LexiGym是一款语言学习应用，帮助用户提升语言技能。它具有离线和多语言支持的创新功能，是最强大的语言学习伴侣。用户可以根据自己的预算选择免费使用或付费订阅，灵活选择学习方式。LexiGym还提供易于创建字典和智能学习等功能，以及详细的训练统计数据。

语言学习词汇训练多语言

Alevels.ai:A Levels AI是一个利用人工智能提高A Levels学习成绩的工具。

A Levels AI利用人工智能技术，提供个性化的学习计划和辅导资源，帮助学生在A Levels考试中取得优异成绩。它通过分析学生的学习情况和弱点，为其提供针对性的学习建议和练习题。A Levels AI还提供实时答疑和学习进度跟踪功能，帮助学生更好地掌握知识。

教育考试辅导人工智能

MailReply:是一款AI助手，可生成专业且人性化的邮件回复，节省时间。

MailReply通过AI生成邮件回复，帮助用户节省时间。它可以在保持人类写作风格的同时，根据邮件内容生成上下文相关的回复。MailReply适用于Windows和macOS，并兼容多种邮件客户端。

邮件回复 AI助手工具

Notification harbor:高性能团队的电子邮件营销平台

Notification harbor是一个为电子邮件营销团队提供AI优化的电子邮件内容和自动化流程的平台。通过使用LLM技术，我们可以在短短5分钟内创建高性能的电子邮件营销内容，并且随着时间的推移，产品甚至可以自我优化。我们的平台简化了电子邮件营销活动的方式，确保每个活动都能精准地与您的目标受众建立联系。AI生成的电子邮件模板根据您提供的信息和要求选择最合适的模板。实时个性化电子邮件可以提高用户参与度和转化率，并根据每个用户实时定制内容。AI驱动的电子邮件营销使您的团队在创建电子邮件模板和文本方面节省了60％的时间。

电子邮件电子邮件营销 AI优化

Magic Loops:通过结合ChatGPT自动化与代码，创建简单的自动化任务

Magic Loops是一种基于ChatGPT的自动化工具，可以连接数据、发送电子邮件、接收短信、爬取网站等功能。它能够帮助用户自动化生活中的各种任务，提高工作效率。Magic Loops的主要优点是可以与各种数据源和应用程序集成，轻松实现个性化的自动化需求。

再见设计师！COLE AI系统利用多模型联合生成高质量设计

今日大家都在搜的词：

热文

站长商机