Design2Code：提供设计图，让多模态LLM自动生成前端代码

2024-03-07 14:38 · 稿源：站长之家

划重点:
⭐️ 生成 AI 在近年来取得了快速进展，具有前所未有的多模态理解和代码生成能力。
⭐️ 研究对可视化设计转换为代码实现的任务进行了系统研究，提出了一套自动评估指标。
⭐️ GPT-4V 在任务中表现出色，生成的网页在视觉外观和内容方面有望取代原始参考网页。

站长之家（ChinaZ.com）3月7日消息:近年来，生成 AI 在多模态理解和代码生成方面取得了显著进展，为前端开发带来了全新的范式。研究人员开展了对视觉设计转换为代码实现任务（称为 Design2Code）的系统研究。

Design2Code是一个微软的开源项目，目的是实现提供设计图，转换为前端代码，适用于前端开发者和设计师。

研究人员手动筛选了484个真实网页作为测试用例，并开发了一套自动评估指标，以评估当前多模态 LLMs 能够多大程度上生成直接渲染为给定参考网页的代码实现，以屏幕截图作为输入。

研究人员开发了一套多模态提示方法，并展示了它们在 GPT-4V 和 Gemini Vision Pro 上的有效性。他们还对开源的 Design2Code-18B 模型进行了微调，成功达到了 Gemini Pro Vision 的性能水平。

测试集示例

基准测试中的一些示例（用于评估目的;下面两行）与 Huggingface 创建的合成数据(用于训练目的;第一行)进行比较。基准测试包含具有不同复杂程度的各种现实世界网页。

人类评估和自动指标显示，GPT-4V 在这一任务中表现出色，标注者认为 GPT-4V 生成的网页在视觉外观和内容方面有望在49% 的情况下取代原始参考网页。令人惊讶的是，在64% 的情况下，标注者认为 GPT-4V 生成的网页甚至比原始参考网页更好。

基准性能:自动指标

对于自动评估，考虑高级视觉相似性（CLIP）和低级元素匹配(块匹配、文本、位置、颜色)。

模型对比

一些案例研究示例来比较不同的提示方法和不同的模型。

详细的细分指标表明，开源模型在从输入网页中召回视觉元素和生成正确布局设计方面大多落后，而在文本内容和着色方面则可以通过适当的微调得到显著改进。

项目入口：https://top.aibase.com/tool/design2code

（举报）

相关推荐

关键词：

霍涛推动开放战略落地，白山云接入快手KAT-Coder赋能开发者

白山云科技与快手StreamLake合作，在其“白山智算”平台上线闭源编程大模型KAT-Coder。该模型在SWE-Bench测试中解决率达73.4%，性能媲美全球顶尖模型，支持端到端代码生成。白山云通过“顶尖模型能力+全球边缘算力”整合，为开发者提供低于300ms超低延时代码生成服务，仅需一行代码即可调用，大幅降低AI开发门槛。此次合作是白山云完善AI工具链布局的关键一步，未来将持续深化开放协作，优化模型与边缘算力服务模式。

白山智算 KAT-Coder AI技术
elexcon官宣定档｜深圳国际电子展 2026年8月25-27日福田启幕

第23届Elexcon深圳国际电子展暨嵌入式展将于2026年8月25-27日在深圳举办。展会以"链接全球电子与嵌入式生态圈"为主题，聚焦电子元器件、嵌入式系统、AI硬件及存储等创新技术。在电子产业面临供应链波动与重构的背景下，展会将汇聚500余家优质供应商及3万余名工程师，通过五大同期活动推动产业对接。往届展会满意度超85%，平台将持续助力企业把握AI、汽车电子、工�
“闪电匣”荣获2025年IDEA国际设计卓越奖，智慧配送闪耀世界舞台！

普渡机器人“闪电匣”凭借卓越设计斩获美国IDEA国际设计大奖。该产品专为酒店半户外场景打造，采用模块化舱体设计，支持2-4格灵活调整，实现毫秒级响应与一键并发配送。搭载VSLAM+3D避障技术，在复杂环境中穿梭自如。一体化简约造型搭配10.1英寸大屏，兼顾美学与实用性。这是普渡继“欢乐送2”后再度获奖，彰显中国配送机器人设计实力。

普渡机器人 IDEA国际设计大奖闪电匣
百度升级文心助手AIGC创作能力：支持8种模态一键调用多工具

百度搜索近日宣布对文心助手进行全面升级，显著增强其AIGC多模态创作与智能任务解决能力。目前，该平台已支持AI图片、视频、音乐、播客等8种内容形态的生成，并支持用户一键调用多种工具，应对生活、健康、教育、工作等多场景需求。数据显示，百度搜索用户通过文心助手日均生成的AIGC内容量已突破千万。与此同时，百度还发布了行业首个开放式实时互动数字人智�

百度搜索文心助手 AIGC
传承海尔，进化自我：Leader统帅的年轻化新路径

在家电行业年轻化浪潮中，统帅品牌以独特视角重新定义年轻家电：依托海尔技术底蕴，通过精准功能裁剪与简约美学设计，将领先技术转化为年轻人真正需要的产品。其核心在于实现"技术轻量化表达"，剔除冗余功能，保留核心体验，让科技自然融入生活。产品设计强调"无感适配"，智能体验注重解决实际问题而非炫技，构建理性精致的消费文化。这种基因传承下的自我进化，使统帅成为年轻人生活中可靠伙伴，重新诠释了高性价比的真正含义——在可靠品质基础上提供恰到好处的体验。

家电行业年轻化海尔智家
简化版Model Y将便宜约10%！特斯拉发布Model 3/Y Standard标准版

特斯拉在北美推出两款低价入门车型：Model Y标准版起售价39990美元，较原版降价5000美元；Model 3标准版起售价36990美元，降价5500美元。两款车型均为后驱设计，但续航、配置大幅精简：Model Y续航降至321英里，移除全景天窗、氛围灯等功能；Model 3音响系统减配至7个扬声器，取消方向盘电动调节等。特斯拉曾计划推出2.5万美元平价电动车，但已被叫停，资源转向自动驾驶领域。目前中国市场是否引入新车尚未确认。

特斯拉 Model Y
Leader统帅官宣品牌大使林高远，懒人新风空调同步上线

10月14日，统帅官宣乒乓球世界冠军林高远成为品牌大使，并发布懒人家族新成员——懒人新风空调。双方提出“懒有引力，有‘球’必应”的生活主张，传递冠军品质与理想生活理念。统帅以“听劝创新”为核心，从解决用户混洗烦恼的“一机三滚筒”洗衣机起步，逐步构建覆盖多元场景的懒人产品矩阵，形成完整居住生态。新品空调搭载AI技术，支持一键懒人模式自动关机，并通过大风量鲜氧新风与四重过滤提升舒适体验。品牌将持续以智慧产品为用户开启高效便捷的懒人新生活。

品牌大使懒人新风空调听劝创新
正浩EcoFlow荣登《时代》杂志2025年度“最佳发明”榜单，OCEAN Pro获评绿色能源类创新典范

《时代》杂志公布2025年度最佳发明榜单，正浩EcoFlow旗舰家庭储能系统OCEAN+Pro入选绿色能源类榜单。该系统通过AI驱动的智能能源管理，实现家庭高效储电与清洁电力调度，支持停电供电与高峰用电优化。这是正浩第三次获此殊荣，其北美洲业务总裁表示奖项印证了品牌在清洁能源创新领域的持续引领力。同时该企业今年还入选《时代》"全球顶尖绿色科技企业250强"，凸显行业领导地位。

时代杂志最佳发明清洁能源
荐AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型；Claude Sonnet4.5发布

本期AI日报聚焦多项技术突破：DeepSeek发布V3.2-exp模型，通过稀疏注意力机制降低API成本50%；Anthropic推出Claude Sonnet 4.5，在编码任务表现卓越；ChatGPT新增即时结账功能，实现对话界面直接购物；OpenAI将推出AI版TikTok，所有内容由Sora2模型生成；百度地图升级小度想想2.0，提供智能出行服务；蚂蚁集团开源万亿参数模型Ring-1T-preview；DeepMind提出“帧链”概念，推动视频模型实现全面�

AI DeepSeek 稀疏注意力
荐AI日报：快手KAT-Dev代码模型开源登顶；全球首款IP66防护人形机器人DR02发布；谷歌Chrome即将引入Gemini新功能

快手开源72B代码模型KAT-Dev在SWE-Bench测试中准确率达74.6%，创国产AI编程里程碑；杭州云深处推出全球首款IP66防护全候作业机器人DR02；谷歌Chrome将集成Gemini引发隐私担忧；学者指控苹果使用盗版书籍训练AI，版权争议再起；Liquid AI发布高效稀疏激活模型LFM2-8B-A1B；苹果拟收购Prompt AI布局智能家居视觉技术；AI伴侣应用泄露4300万条用户隐私对话；西湖大学DeepScientist显著提升科研效率。

AI日报快手72B代码模型 KAT-Dev

今日大家都在搜的词：

热文

3 天
7天

Design2Code：提供设计图，让多模态LLM自动生成前端代码

霍涛推动开放战略落地，白山云接入快手KAT-Coder赋能开发者

elexcon官宣定档｜深圳国际电子展 2026年8月25-27日福田启幕

“闪电匣”荣获2025年IDEA国际设计卓越奖，智慧配送闪耀世界舞台！

百度升级文心助手AIGC创作能力：支持8种模态一键调用多工具

传承海尔，进化自我：Leader统帅的年轻化新路径

简化版Model Y将便宜约10%！特斯拉发布Model 3/Y Standard标准版

Leader统帅官宣品牌大使林高远，懒人新风空调同步上线

正浩EcoFlow荣登《时代》杂志2025年度“最佳发明”榜单，OCEAN Pro获评绿色能源类创新典范

荐AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型；Claude Sonnet4.5发布

荐AI日报：快手KAT-Dev代码模型开源登顶；全球首款IP66防护人形机器人DR02发布；谷歌Chrome即将引入Gemini新功能

今日大家都在搜的词：

热文

AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；S

卢伟冰官宣REDMI K90系列下周发布：不排斥和小米竞争

苹果华为OPPO将推出eSIM手机 OPPO Find X9系列已确认将支持

微信回应出朋友圈访客功能：可能会让用户产生焦虑重申不会推出

REDMI K90 Pro Max外观公布：后置BOSE认证扬声器

知乎崩了上热搜：网页端完全无法进入 App端也未能幸免

华为nova 14活力版、nova Flip S官宣明天发布

红米REDMI K90 Pro Max丹宁色亮相采用第三代科纳皮设计

苹果14英寸MacBook Pro发布：售价12999元起首发苹果M5芯片

AI日报：谷歌Gemini 3.0 Pro小范围推送；爱诗科技完成1亿元B+轮

微信员工回应好友互删后互动清除：并非新版本特性

AI日报：LiblibAI 2.0正式上线；通义千问、豆包开启记忆功能；

董明珠称格力向特斯拉提供服务已有近14万项专利技术

微信回应人去世了朋友圈会消失吗：长时间不使用账号已不再回收

卢伟冰调侃还有小米6钉子户：小米6机主宣布换机小米17

京东回应下场造车：不直接涉及制造三方联合推出

库克下月满65岁苹果或迎特努斯时代：有望执掌十年以上

Windows 10即将“停服”上热搜微软建议用户升级Win 11

AI日报：阿里发布紧凑型Qwen3-VL模型；科大讯飞AI翻译耳机全球

小米推出短剧App围观短剧：主打无广告免费看

站长商机