首页 > 业界 > 关键词  > Design2Code最新资讯  > 正文

Design2Code:提供设计图,让多模态LLM自动生成前端代码

2024-03-07 14:38 · 稿源:站长之家

划重点:

⭐️ 生成 AI 在近年来取得了快速进展,具有前所未有的多模态理解和代码生成能力。

⭐️ 研究对可视化设计转换为代码实现的任务进行了系统研究,提出了一套自动评估指标。

⭐️ GPT-4V 在任务中表现出色,生成的网页在视觉外观和内容方面有望取代原始参考网页。

站长之家(ChinaZ.com)3月7日 消息:近年来,生成 AI 在多模态理解和代码生成方面取得了显著进展,为前端开发带来了全新的范式。研究人员开展了对视觉设计转换为代码实现任务(称为 Design2Code)的系统研究。

Design2Code是一个微软的开源项目,目的是实现提供设计图,转换为前端代码,适用于前端开发者和设计师。

研究人员手动筛选了484个真实网页作为测试用例,并开发了一套自动评估指标,以评估当前多模态 LLMs 能够多大程度上生成直接渲染为给定参考网页的代码实现,以屏幕截图作为输入。

研究人员开发了一套多模态提示方法,并展示了它们在 GPT-4V 和 Gemini Vision Pro 上的有效性。他们还对开源的 Design2Code-18B 模型进行了微调,成功达到了 Gemini Pro Vision 的性能水平。

测试集示例

基准测试中的一些示例(用于评估目的;下面两行)与 Huggingface 创建的合成数据(用于训练目的;第一行)进行比较。基准测试包含具有不同复杂程度的各种现实世界网页。

image.png

人类评估和自动指标显示,GPT-4V 在这一任务中表现出色,标注者认为 GPT-4V 生成的网页在视觉外观和内容方面有望在49% 的情况下取代原始参考网页。令人惊讶的是,在64% 的情况下,标注者认为 GPT-4V 生成的网页甚至比原始参考网页更好。

基准性能:自动指标

对于自动评估,考虑高级视觉相似性(CLIP)和低级元素匹配(块匹配、文本、位置、颜色)。

image.png

模型对比

一些案例研究示例来比较不同的提示方法和不同的模型。

image.png

详细的细分指标表明,开源模型在从输入网页中召回视觉元素和生成正确布局设计方面大多落后,而在文本内容和着色方面则可以通过适当的微调得到显著改进。

项目入口:https://top.aibase.com/tool/design2code

举报

  • 相关推荐
  • 死了么APP宣布改名:启用全球化品牌名Demumu

    “死了么”APP宣布将启用全球化品牌名Demumu。该应用专为独居人群设计,通过签到机制监测用户安全,若多日未签到将自动通知紧急联系人。目前仅iOS版售价8元,已登顶苹果工具类应用榜首。其独特功能获BBC报道,助力海外市场爆发增长。创始人透露,应用初期投入不足1500元,下载量增长约300倍。团队无意添加广告,计划融资50万美元推动发展。

  • DeepGEO上线GEO品牌诊断功能,六大模块为企业品牌精准“把脉”

    国内领先的智能数据平台DeepGEO推出“GEO品牌诊断”新功能,通过六大模块为企业提供从用户洞察、基础建设评估、效果追踪到竞争分析、舆情监控及优化建议的全方位数字化评估,助力品牌科学决策与精准管理,实现价值持续增长。

  • 死了么APP征集全新品牌名 已撤回此前更名Demumu

    “死了么”APP原计划在即将发布的新版本中启用全球化品牌名Demumu,但官方在宣布后因更名尝试未能尽如人意,决定将命名权交还给网友。此前,该APP强调因海外业务爆发式增长,未来将坚持安全守护初心,把源自中国的守护方案带向世界。新名Demumu中,“De”取自英文“Death”,紧扣“死亡”核心概念;“mumu”则营造亲切可爱的“Q萌”感。此举引发网友广泛讨论,部分持反对意见。鉴于争议,官方改变策略,诚邀网友大开脑洞为APP取新名字,将选取最佳创意,奖励第一位提出该名字的获选用户666元现金红包。

  • AI日报:DeepSeek V4或于2月发布;Midjourney Niji 7发布;AI聊天App涉黄案二审在即

    本期AI日报聚焦多领域进展:DeepSeek V4或春节发布,主打AI编程能力;Midjourney推出Niji 7模型,显著提升动漫风格生成质量;Mugen3D实现单图生成高保真3D模型;Lightricks开源视频模型LTX-2,支持20秒音视频一体化合成。同时,抖音科技内容年观看量达1.4万亿次,成为科普新渠道;国内首例AI聊天App涉黄案二审在即,凸显合规重要性;谷歌AI健康搜索因误导性内容遭质疑并下线部分功能;此外,谷歌联合零售巨头推出UCP协议,旨在通过AI代理实现全链路无缝购物体验。

  • 可以科技携全球首款桌面AI伙伴DeskMate登陆2026 CES 开启“人机共生”新范式

    2026年CES展上,中国机器人企业可以科技发布战略新品DeskMate。作为全球首款融合情感交互与办公助理功能的桌面机器人,它通过多模态AI感知与实时情感计算,实现“无需下令,主动理解”的自然交互,旨在重新定义人机协作新模式。其核心突破在于“仿生角色AI系统”,能实时捕捉用户表情、动作与语音,动态生成相应反馈,摆脱传统机器人的机械感。DeskMate深度集成于工作环境,可同步电脑内容、接入主流办公软件,像同事一样自然对话并提供完整结果,实现“零提示词交互”。此外,它还能识别用户工作状态,提供情感陪伴,缓解远程办公的孤独感。公司计划于2026年2月底启动新一轮融资,加速产品研发与全球市场拓展。

  • 特斯拉首推7年超低息购车方案:Model Y L 已支持5年0息方案

    今日,特斯拉正式发布针对多款车型的全新购车金融政策,其中涵盖 7 年超低息及 5 年 0 息等极具吸引力的方案,旨在为消费者提供更加灵活多样的购车选择。 据特斯拉官方介绍,此次金融政策覆盖Model 3、Model Y以及Model Y L三款热门车型。 具体而言,Model3 与Model Y均提供首付7. 99 万元起的选项,月供分别低至 1918 元和 2263 元;而Model Y L则首付9. 99 万元起,月供可低至 2947 元。

  • aigo 亮相 CES 2026,以科技硬实力诠释中国智造

    在CES 2026上,中国品牌aigo宣布以AI技术为核心完成战略升级,并全球首展了基于自研HOLOPTIC4D光场技术的柔性工业机器人。其产品矩阵覆盖多元场景,包括已进入全美600余家Costco的电动滑板车,以及音频设备、电脑组件、智能穿戴与个人护理等多品类消费电子产品,展现了“产业智能化+消费科技全球化”的双端实力。aigo凭借硬核创新与全品类布局,持续在国际舞台擦亮中国智造名片。

  • 微星发布全新星爵Modern 14S/16S:11.1mm、1.3kg轻薄机身

    微星在CES 2026期间,发布了新一代星爵14S/16S笔记本,14 英寸版本至薄11.1mm,至轻1.3kg。 该系列采用全新设计语言,整机拥有更多金属材质,轮廓更流畅、更圆润。 核心配置方面星爵S搭载全新一代酷睿Ultra 7 355处理器,全系配备双内存插槽,存储升级更灵活方便。 屏幕则为1920*1200分辨率的OLED屏,提供USB-A、USB-C(支持视频输出和快充功能)、HDMI、RJ-45网口、Micro SD等扩展接口�

  • CertiK联合YZi Labs设立100万美元安全审计资金,支持EASY Residency孵化项目

    全球最大Web3安全公司CertiK与投资机构YZi Labs(原币安实验室)达成战略合作,将共同提升其孵化计划EASY Residency参与项目的安全架构。CertiK将设立100万美元专项安全审计资金,并提供形式化验证、AI扫描等服务支持。双方合作旨在将安全从“可选项”升级为创业初期的“必选项”,推动Web3行业从追求速度向保障安全的根本性转变。

  • 2025正当红年度盛典正式启幕,见证AIGC内容生态当红力量

    12月27日,“正当红”百家合伙人年度盛典在海口举行,超300位AIGC创作者齐聚,共同见证年度荣誉揭晓。百度APP通过工具提效、内容创作、商业化等多层面赋能,助力AIGC从技术概念成为照亮内容生态的“当红力量”。活动揭晓了百度AIGC未来创作联赛S2赛季优秀作品,其中《完美偏差》获最高奖项。现场还发布了“IP-AIGC创享计划”,旨在构建创作者、版权方、平台三方共赢的产业新生态。百度APP宣布升级“漫画合伙人计划”,整合分账激励、流量扶持等资源,构建增长闭环。独立漫画APP“柚漫”正式上线,打造年轻人首选的免费漫画平台。AIGC行业正从“工具觉醒”迈向“生态爆发”,百度APP将持续重构创作边界,为创作者开辟价值实现路径,为用户带来更丰富的内容消费体验。

今日大家都在搜的词: