首页 > 业界 > 关键词  > DeepMind最新资讯  > 正文

谷歌DeepMind新方法Gecko,为测试AI图像生成器引入严格新标准

2024-04-30 09:52 · 稿源:站长之家

划重点:

⭐ 谷歌 DeepMind 发布了新的基准 Gecko,揭示了当前文本到图像 AI 评估方法的缺陷,并引入了一个包含超过10万份人类评分的严格新标准。

⭐ “Gecko” 基准通过2000个文本提示对文本到图像模型全面评估,同时提供了增强的自动评估指标,揭示了先前未被发现的模型优和劣势。

⭐ 研究人员希望通过 “Gecko” 基准的引入,能够更准确地评估和诊模型的能力,促进 AI 技术的进一步发展。

站长之家(ChinaZ.com)4月30日 消息:谷歌 DeepMind 最近的研究示了当前我们对文本到图像 AI 模型性能评估的隐藏局限性。在其发布在预印本服务器 ariv 上的研究中,他们引入了一种全新的方法称为 “Gecko”,承诺提供一个更全和可靠的基准,以评估这一蓬勃发展的技术。

image.png

研究团队在其题为 “用 Gecko 审视文本到图像评估:对度量、提示和人类评分” 的论文中警告称:“虽然文到图像生成模型已经变得无处不在,但它们并不一定生成与给定提示相一致的图。” 他们指出,目前主要用于评估 DALL-E、Midjourney 和 Stable Diffusion 等模型能力数据集和自动度量并不能全面反映实际情况。

小规模的人类评估提供了有限的解,而自动度量可能会忽略重要细微之处,甚至与人类评委产生分歧。 为了揭示这些问题,研究人员开发了 “Gecko”—— 一个新的基准套件,它为文本到图模型提供了更高难度的测试。Gecko基准通过2000个文本提示对模型进行全面考核,探究各种技能和复杂程度。它将这些提示分成具体的子技能,超越模糊的类,以准确找出限制模型的确切弱点。

研究人员还收集了对数个领先模型生成的图像进行的超过10万份人类评分。这一基准可以揭示模型性能差距是源自模型真正的局限性、模糊的提示,还是评估方法的不一致。

“Gecko” 基准还采用了一个基于问的增强自动评估指标,与人类判断更为相关。当用于比较新基准下的最先进模型时,这一组合揭示了先前未被发现的模型优势和劣势。 研究人员希望他的工作能够证明使用多样的基准和评估方法来真正了解文本到图像 AI 在实际部署前能做什么,不能做什么的重要性。他们计划免费公开 “Gecko” 代码和数据,推动进一步的进展。 因此,尽管那些看似令人印象深刻的作品可能乍一看令人印象深刻,但我们仍然需要严格的测试来区分真假。Gecko为我们展示了如何做到这一。

论文:https://arxiv.org/pdf/2404.16820

举报

  • 相关推荐
  • 如何用 DeepSeek 生成备课教案

    本教程介绍如何利用AI工具DeepSeek快速生成七年级中国古代史教案。操作流程包括:1.登录DeepSeek官网;2.进入文本生成界面;3.输入详细指令,包含教学目标、重难点、教学过程等要素;4.等待AI生成教案;5.检查并调整内容。该工具能帮助教师高效完成系统化的教案设计,但生成后仍需根据实际教学需求进行适当修改和完善,最后保存为所需格式使用。

  • 如何用 DeepSeek 生成星球日更内容

    本文介绍如何利用DeepSeek工具高效生成星球日更内容。主要内容包括:1.注册登录DeepSeek官网进入对话界面;2.输入精准指令获取内容,如"生成7篇藏马鸡主题的星球日更";3.对生成内容进行相关性、实用性评估;4.通过补充指令优化不满意内容。该工具能快速提供多样化素材,解决持续创作压力,经过多次调整可获得符合定位的优质内容。操作流程简单,适合自媒体运营和社群内容创作。

  • 如何用 DeepSeek 生成爆款标题

    本文介绍如何利用DeepSeek工具快速生成15个爆款标题,提升内容吸引力。操作步骤:1.访问DeepSeek官网;2.输入指令,如"为夏日低卡甜品生成15个小红书标题",要求包含emoji、数字或关键词;3.根据不同平台特性调整风格:小红书需活泼多用emoji,知乎要理性干货,抖音则简短有力突出冲突。该工具能帮助创作者在海量信息中脱颖而出,解决标题创作难题。

  • 如何用 DeepSeek 生成重点知识梳理

    本教程介绍如何使用DeepSeek AI工具快速生成结构化知识梳理。以"光合作用"为例,通过简单指令即可获得包含定义、过程、影响因素、意义及与呼吸作用比较的思维导图。操作流程:1.登录DeepSeek官网;2.输入指定格式的指令;3.选择输出格式;4.提交生成;5.查看并调整结果。该工具适用于学习资料整理、知识框架搭建等场景,能高效呈现复杂知识的逻辑结构,帮助用户快速掌握重点内容。

  • 如何用deepseek生成短视频脚本

    本文介绍如何利用DeepSeek工具快速生成30秒短视频脚本。该工具可根据用户需求,自动生成包含开场悬念、核心干货、反转情节和结尾互动的优质脚本。操作流程包括:1.登录DeepSeek官网;2.输入具体指令(如"生成洗发水广告脚本,需包含开场悬念+3个核心干货+结尾互动");3.检查并优化脚本内容;4.补充画面风格、背景音乐等细节。通过多次指令调整可获得更理想的脚本

  • 如何用 DeepSeek 生成周会临时发言内容

    本文介绍如何利用DeepSeek AI工具快速生成三种实用会议发言模板:1)进度汇报模板,包含已完成事项、当前进展和所需支持;2)提建议模板,包括现象观察、建议方案和预期效果;3)甩锅模板,说明影响因素、已采取措施和协作建议。操作步骤为:登录DeepSeek官网,输入指定格式指令,AI会自动生成模板内容,用户可根据实际情况替换变量、补充具体数据。该工具能帮助职场人士高效准备结构清晰、逻辑严谨的会议发言,适用于工作汇报、应急沟通等场景。

  • 如何用 DeepSeek 生成教育领域演讲稿

    文章介绍如何利用DeepSeek AI工具快速生成高质量演讲稿。主要步骤包括:1.访问DeepSeek官网注册登录;2.输入清晰指令,如"帮我写一份关于人工智能在教育中应用的演讲稿";3.生成初稿后检查内容,可补充指令优化;4.最终整理完善,调整格式和语言表达。该工具能帮助教育工作者高效完成学术汇报、教师培训等场景的讲稿撰写,突出AI优势同时提出应对策略。

  • 如何用 DeepSeek 生成简洁吸引人的招聘广告

    本文介绍如何利用AI工具DeepSeek快速生成优质招聘广告。在当前激烈的招聘竞争中,高效产出优质广告至关重要。操作流程包括:1.访问DeepSeek官网注册登录;2.输入具体指令,如"帮我撰写针对XX岗位的招聘广告";3.查看生成结果并进行优化调整;4.复制最终文案用于各大招聘平台发布。该工具能快速生成简洁吸引人的广告内容,包含企业亮点和应聘方式,适用于智联招聘、BOSS直聘等平台,帮助HR提升招聘效率。

  • 谷歌推出终端AI编程工具Gemini CLI Gemini CLI安装使用教程一览

    近日,谷歌在AI编程领域推出了一款备受瞩目的终端AI编程工具——Gemini CLI。这款免费开源的工具一经发布,便在开发者群体中引发了广泛关注,其强大的功能和免费开源的特性,使其在众多同类产品中脱颖而出,甚至让一些竞争对手如Claude Code相形见绌。 如果您对AI编程工具感兴趣,想要了解更多类似的产品,可以访问 [AIbase - 智能匹配最适合您的AI产品和网站](https://top.aiba

  • 高考数学全卷重赛!一道题难倒所有大模型,新选手Gemini夺冠,豆包DeepSeek并列第二

    本次AI高考数学测试评估了7个大模型的表现,包括Doubao、DeepSeek、Qwen3等。测试包含14道客观题和5道解答题,总分150分。结果显示:1)客观题各模型差距不大,最大分差仅3分;2)解答题成为主要失分区,仅Gemini2.5Pro获得满分;3)图像识别题(第6题)难倒所有多模态模型,暴露AI图文理解短板。最终Gemini2.5Pro以145分居首,Doubao和DeepSeek R1以144分并列第二。测试表明大模型在数学推理能力上有进步,但在复杂论证和多步骤计算方面仍需提升。