首页 > 业界 > 关键词  > Meta最新资讯  > 正文

Meta发布AI基准测试工具FACET 用于评估 AI 模型的“公平性”

2023-09-01 14:09 · 稿源:站长之家

要点:

  • Meta发布了名为FACET的数据集,用于探测计算机视觉模型对某些“类别”人群的偏见。

  • FACET包含32000张图片,50000人的图像,标注了职业和活动“类别”,以及人口统计和身体特征。

  • FACET可用于测试模型在不同人口属性上的分类、检测、分割和定位任务的公平性。

站长之家(ChinaZ.com) 9月1日 消息:Meta今天发布了一个新的AI基准测试,名为FACET,旨在评估在照片和视频中对人和物体进行分类和检测的AI模型的“公平性”。

FACET由32,000张包含50,000个人标签的图像组成,这些标签由人类注释者标注。除了与职业和活动相关的类别,如“篮球运动员”、“DJ”和“医生”,还包括人口统计和身体属性,使Meta能够对针对这些类别的偏见进行“深度”评估。

Meta在一篇与TechCrunch共享的博客文章中写道:“通过发布FACET,我们的目标是让研究人员和从业者能够进行类似的基准测试,以更好地理解他们自己的模型中存在的偏见,并监控所采取的缓解措施对这些偏见的影响。” “我们鼓励研究人员使用FACET来评估其他视觉和多模态任务的公平性。”

人工智能 科幻

注:图片由midjourney生成

当然,探测计算机视觉算法偏见的基准测试并不是什么新鲜事。Meta自己几年前就发布过一个基准测试,用于揭示计算机视觉和音频机器学习模型中的年龄、性别和肤色歧视。许多研究已经对计算机视觉模型进行了评估,以确定它们是否存在针对某些人群的偏见。

此外,事实上,Meta 在负责任的人工智能方面并没有最好的记录。去年年底,Meta不得不撤下一款AI演示,因为它编写了种族主义和不准确的科学文献。有报道称,该公司的AI伦理团队基本没有作用,而它发布的反AI偏见工具被形容为“完全不足够”。同时,学术界指责Meta加剧了其广告服务算法中的社会经济不平等,并在其自动审查系统中表现出对黑人用户的偏见。

但Meta声称FACET比之前所有的计算机视觉偏见基准测试都要深入——能够回答这样的问题:“当被感知的性别表现具有更多传统男性特征时,模型是否在将人们分类为滑板运动员方面做得更好?”以及“当头发卷曲程度与直发相比时,任何偏见都会放大吗?”

为了创建FACET,Meta让上述注释者为32,000张图像中的每张人物图像标注人口统计属性(例如图片中人物的感知性别表现和年龄组)、额外的身体属性(例如肤色、光线、纹身、头饰和眼镜、发型和面部毛发等)以及类别。他们将这些标签与其他来自Segment Anything1Billion的关于人、头发和服装的标签结合。Segment Anything1Billion是Meta设计的用于训练计算机视觉模型从图像中“分割”或隔离物体和动物的数据集。

Meta告诉我,FACET图像的来源是Segment Anything1Billion,而这些图像则从“照片提供商”处购买。但目前还不清楚图片中所描绘的人是否知道他们的图片将被用于这个目的。此外——至少在博客文章中——还不清楚Meta是如何招募注释者团队的,以及他们得到了多少工资。

从历史上看,甚至在今天,许多为AI培训和基准测试标注数据集的注释者来自发展中国家,收入远低于美国的最低工资标准。就在本周,《华盛顿邮报》报道,规模最大、融资最充足的注释公司之一Scale AI向工人支付的工资极低,经常拖欠或扣发工资,并为工人提供寻求救济的渠道很少。

在描述FACET如何诞生的白皮书中,Meta表示注释者是“经过培训的专家”,他们来自包括北美(美国)、拉丁美洲(哥伦比亚)、中东(埃及)、非洲(肯尼亚)、东南亚(菲律宾)和东亚(台湾)等多个地理区域。Meta表示,它使用了来自第三方供应商的“专有注释平台”,并按照每个国家一小时的工资标准向注释者提供报酬。

撇开FACET可能存在问题的出处不谈,Meta表示该基准测试可用于探测不同人口统计属性下的分类、检测、“实例分割”和“视觉基础”模型。

作为测试用例,Meta将其自己的DINOv2计算机视觉算法应用于FACET,该算法已于本周开始商业使用。Meta表示,DINOv2发现了几种偏见,包括对某些性别表现的人的偏见以及对典型地将女性照片识别为“护士”的可能性的偏见。

在博客文章中,Meta写道:“DINOv2预训练数据集的准备过程可能无意中复制了为策展选择的参考数据集中的偏见。我们计划在未来的工作中解决这些潜在的不足之处,并相信基于图像的策展也可以帮助避免因使用搜索引擎或文本监督而产生的潜在偏见。”

没有完美的基准测试。值得称赞的是,Meta承认FACET可能无法充分捕捉现实世界的概念和人口群体。它还指出,由于自FACET创建以来,许多职业形象可能已经发生了变化。例如,在COVID-19大流行期间拍摄的FACET中的大多数医生和护士都佩戴了比大流行前更多的个人防护装备。

在白皮书中,Meta写道:“目前我们不打算更新此数据集。我们将允许用户标记任何可能令人反感的内容,并在发现时删除这些内容。”

除了数据集本身外,Meta还提供了一个基于网络的数据集浏览器工具。要使用该工具和数据集,开发人员必须同意不将其用于训练计算机视觉模型——而只用于评估、测试和基准测试。

举报

  • 相关推荐
  • 大家在看
  • AI Lyrics Generator:利用AI技术快速生成原创歌词

    AI Lyrics Generator是一个基于人工智能技术的在线歌词生成工具,专为词曲作者、音乐家和创意人士设计。它能够根据用户输入的风格、主题和情感等参数,快速生成原创歌词。这个工具利用先进的机器学习算法,模仿人类创作歌词的过程,为用户提供灵感和创作辅助。AI Lyrics Generator不仅能够节省创作时间,还能拓宽创作视野,帮助用户探索不同的音乐风格和表达方式。

  • Fancy Text Generator:创意文字转换器,轻松生成独特、炫酷的文字效果。

    Fancy Text Generator是一个在线工具,利用AI算法为用户提供多种风格的花式文字生成服务。它支持包括花式字体、emoji装饰、特殊符号在内的多种文字效果,适用于社交媒体、个人签名、艺术创作等场景。该产品的主要优点包括用户友好的界面、快速生成作品的能力、高分辨率输出以及社区分享功能。它免费在线使用,无需下载,适合所有希望在数字平台上展示个性化文字的用户。

  • Flux Lora Online:在线生成精美图片,释放创意潜力。

    Flux Lora Online 是一个在线平台,提供多种 Flux Lora 模型,用于生成各种风格的图像。这些模型包括但不限于写实风格、动漫风格、迪士尼风格等,能够满足不同用户对图像生成的多样化需求。平台采用先进的图像生成技术,提供高分辨率和细节丰富的图像,同时拥有用户友好的界面,简化工作流程,提高生产力。

  • Vadoo AI:AI视频生成器,将文本快速转化为视频。

    Vadoo AI是一个全功能的AI视频生成器,它使用先进的人工智能技术,让用户能够将文本提示快速转化为视频内容。该产品支持多种语言字幕,提供多种视频风格和模板,以及背景音乐和自动缩放等功能,使得视频制作变得简单而高效。Vadoo AI的目标是帮助用户,无论是社交媒体创作者还是企业营销人员,都能轻松创建专业质量的视频内容,以吸引和保持观众的注意力。

  • AI Youtube Shorts Generator:从长视频中生成引人入胜的YouTube短片

    AI Youtube Shorts Generator 是一个利用GPT-4和Whisper技术的Python工具,它可以从长视频中提取最有趣的亮点,检测演讲者,并将内容垂直裁剪,以适应短片格式。这个工具目前处于0.1版本,可能存在一些bug。

  • Cavela:全球首个虚拟采购代理,连接全球制造商网络

    Cavela是一个创新的虚拟采购代理平台,它通过自动化技术连接全球的供应商网络,为企业提供从供应商匹配、报价编制、样品生产、质量保证到订单交付的一站式服务。Cavela通过其平台,帮助企业降低采购成本,提高效率,同时确保产品质量。它特别适合需要全球采购资源的中小型企业和初创公司,帮助他们在竞争激烈的市场中快速响应市场需求。

  • Landerino:最简洁的网页构建器,设计至上

    Landerino是一个创新的网页构建平台,它通过提供简单易用的界面,让用户能够快速创建、编辑和发布落地页。它不仅支持实时编辑和预览,还提供了强大的分析工具,帮助用户优化页面并进行A/B测试。Landerino的目标是让每个人都能轻松地构建和管理自己的网页,无需专业的技术背景。它通过简化网页制作流程,降低了维护成本,使内容创造成为焦点。

  • Mneme AI:在设备上与您的笔记进行对话,提升生产力。

    Mneme AI 是一款运行在iPhone上的本地AI助手应用,它允许用户通过与个人笔记、文档和书籍的对话来提高工作效率。这款应用完全离线运行,确保了用户数据的隐私和安全。Mneme AI 通过提供个性化的响应,帮助用户整理思绪和知识,支持用户使用内置文本编辑器记录新笔记或添加PDF文档。它支持英语,并推荐在iPhone 14或更新型号上使用以获得最佳性能。

  • AI-Faceless-Video-Generator:利用AI生成视频脚本、语音和会说话的头像

    AI-Faceless-Video-Generator是一个利用人工智能技术,根据话题生成视频脚本、语音和会说话头像的项目。它结合了sadtalker进行面部动画,gTTS生成AI语音和OpenAI语言模型生成脚本,提供了一个端到端的解决方案,用于生成个性化视频。该项目的主要优点包括脚本生成、AI语音生成、面部动画创建以及易于使用的界面。

  • FLUX.1-dev-LoRA-Dark-Fantasy:生成幻想生物和角色的AI模型

    FLUX.1-dev-LoRA-Dark-Fantasy是由Shakker AI的GUIZANG(歸藏)训练的LoRA模型,专注于生成幻想生物和角色。该模型受到Klee、Odilon Redon、Eyvind Earle等艺术家的影响,能够生成具有电影质感、复杂光影效果和精细细节的图像。模型遵循flux-1-dev-non-commercial-license,适用于非商业用途。

  • 通义万相AI视频生成:利用AI技术,将文字和图像转化为创意视频。

    通义万相AI创意作画是一款利用人工智能技术,将用户的文字描述或图像转化为视频内容的产品。它通过先进的AI算法,能够理解用户的创意意图,自动生成具有艺术感的视频。该产品不仅能够提升内容创作的效率,还能激发用户的创造力,适用于广告、教育、娱乐等多个领域。

  • Windows Agent Arena:用于测试和开发AI代理的可扩展开源框架

    Windows Agent Arena (WAA) 是一个专注于Windows操作系统的可扩展、开源框架,用于测试和开发能够使用语言模型在PC上进行推理、规划和行动的AI代理。它通过模拟真实的Windows环境,允许代理自由操作,并使用与人类用户相同的应用程序、工具和网络浏览器来解决任务。WAA通过Azure实现可扩展性和并行化,能够在短短20分钟内完成完整的基准测试评估。

  • VELS by Kaiden AI:AI驱动的模拟训练,提升沟通技能。

    VELS by Kaiden AI是一个基于人工智能的模拟训练平台,提供定制化、反馈丰富的模拟场景,帮助用户准备各种交流互动。该平台通过创建逼真的训练场景和AI虚拟对话伙伴,模拟真实世界的交流环境,让用户在安全的环境中练习和提高沟通技能。VELS通过实时反馈和性能分析,为用户提供个性化的训练体验,帮助他们在各种行业和角色中提升表现。

  • Selfplanr:规划你的高中四年,迈向梦想大学。

    Selfplanr是一个为高中生设计的在线规划工具,旨在帮助学生规划他们的高中生涯,以实现进入理想大学的目标。通过个性化的目标设定、动态的四年规划、每周任务安排、与导师和同伴的协作规划以及动态进度跟踪,Selfplanr帮助学生构建全面而独特的简历,发现学术之外的无数机会,如实习、奖学金、研究和志愿活动。

  • GoMaxAI:一站式AI服务,提供多样化智能解决方案。

    GoMaxAI是一个集成了多种AI功能的平台,旨在为用户提供包括3D视频创建、智能问答、AI绘画、文档分析和思维导图等多种智能服务。它通过先进的AI技术,帮助用户在影视制作、设计、艺术创作、信息处理等领域提高效率和创造力。

  • XVERSE-MoE-A36B:多语言大型语言模型,支持多领域文本生成。

    XVERSE-MoE-A36B是由深圳元象科技自主研发的多语言大型语言模型,采用混合专家模型(MoE)架构,具有2554亿的总参数规模和360亿的激活参数量。该模型支持包括中、英、俄、西等40多种语言,特别在中英双语上表现优异。模型使用8K长度的训练样本,并通过精细化的数据采样比例和动态数据切换策略,保证了模型的高质量和多样性。此外,模型还针对MoE架构进行了定制优化,提升了计算效率和整体吞吐量。

  • Peter Cat:智能答疑机器人解决方案,助力GitHub社区维护者和开发者

    Peter Cat 是一个专为社区维护者和开发者打造的智能答疑机器人解决方案。它通过对话式答疑 Agent,配置系统、自托管部署方案和便捷的一体化应用SDK,让用户能够一键创建智能答疑机器人,并快速集成到各类官网或项目中,为社区提供更高效的技术支持生态。

  • Covers:将您的音乐作品转换为全新风格。

    Covers 是 Suno 推出的一款音乐创作工具,它允许用户将任何声音,从简单语音备忘录到完整制作的音乐,转换成全新风格的音乐作品,同时保留原始的旋律。这一功能特别适合想要尝试不同音乐风格或为纯音乐添加歌词的音乐创作者。Covers 目前处于早期访问测试阶段,向所有 Pro 和 Premier 订阅者提供,用户可以免费试用200次,之后每次生成新 Cover 将消耗10个积分。

  • AgentRE:基于代理的框架,用于在复杂信息环境中进行关系抽取。

    AgentRE是一个基于代理的框架,专门设计用于在复杂信息环境中进行关系抽取。它通过模拟智能代理的行为,能够高效地处理和分析大规模数据集,从而识别和提取实体之间的关系。该技术在自然语言处理和信息检索领域具有重要意义,尤其是在需要处理大量非结构化数据的场景中。AgentRE的主要优点包括其高度的可扩展性、灵活性以及对复杂数据结构的处理能力。该框架是开源的,允许研究人员和开发者自由使用和修改,以适应不同的应用需求。

  • GoMaxAI Pro版 (ChatGPT-Midjourney):个人、团队、企业私有化AIGC应用平台

    GoMaxAI Pro版是一个基于Node.js、Vue3、uniapp开发的AIGC平台,提供ChatGPT、Midjourney绘画、Suno音乐、Pika/Runway/Sora视频服务。它支持私有化部署,适用于个人、团队和企业,强调用户体验和资源集成,具备权限管理和安全审计功能。

今日大家都在搜的词: