首页 > 业界 > 关键词  > Meta最新资讯  > 正文

Meta发布AI基准测试工具FACET 用于评估 AI 模型的“公平性”

2023-09-01 14:09 · 稿源:站长之家

要点:

  • Meta发布了名为FACET的数据集,用于探测计算机视觉模型对某些“类别”人群的偏见。

  • FACET包含32000张图片,50000人的图像,标注了职业和活动“类别”,以及人口统计和身体特征。

  • FACET可用于测试模型在不同人口属性上的分类、检测、分割和定位任务的公平性。

站长之家(ChinaZ.com) 9月1日 消息:Meta今天发布了一个新的AI基准测试,名为FACET,旨在评估在照片和视频中对人和物体进行分类和检测的AI模型的“公平性”。

FACET由32,000张包含50,000个人标签的图像组成,这些标签由人类注释者标注。除了与职业和活动相关的类别,如“篮球运动员”、“DJ”和“医生”,还包括人口统计和身体属性,使Meta能够对针对这些类别的偏见进行“深度”评估。

Meta在一篇与TechCrunch共享的博客文章中写道:“通过发布FACET,我们的目标是让研究人员和从业者能够进行类似的基准测试,以更好地理解他们自己的模型中存在的偏见,并监控所采取的缓解措施对这些偏见的影响。” “我们鼓励研究人员使用FACET来评估其他视觉和多模态任务的公平性。”

人工智能 科幻

注:图片由midjourney生成

当然,探测计算机视觉算法偏见的基准测试并不是什么新鲜事。Meta自己几年前就发布过一个基准测试,用于揭示计算机视觉和音频机器学习模型中的年龄、性别和肤色歧视。许多研究已经对计算机视觉模型进行了评估,以确定它们是否存在针对某些人群的偏见。

此外,事实上,Meta 在负责任的人工智能方面并没有最好的记录。去年年底,Meta不得不撤下一款AI演示,因为它编写了种族主义和不准确的科学文献。有报道称,该公司的AI伦理团队基本没有作用,而它发布的反AI偏见工具被形容为“完全不足够”。同时,学术界指责Meta加剧了其广告服务算法中的社会经济不平等,并在其自动审查系统中表现出对黑人用户的偏见。

但Meta声称FACET比之前所有的计算机视觉偏见基准测试都要深入——能够回答这样的问题:“当被感知的性别表现具有更多传统男性特征时,模型是否在将人们分类为滑板运动员方面做得更好?”以及“当头发卷曲程度与直发相比时,任何偏见都会放大吗?”

为了创建FACET,Meta让上述注释者为32,000张图像中的每张人物图像标注人口统计属性(例如图片中人物的感知性别表现和年龄组)、额外的身体属性(例如肤色、光线、纹身、头饰和眼镜、发型和面部毛发等)以及类别。他们将这些标签与其他来自Segment Anything1Billion的关于人、头发和服装的标签结合。Segment Anything1Billion是Meta设计的用于训练计算机视觉模型从图像中“分割”或隔离物体和动物的数据集。

Meta告诉我,FACET图像的来源是Segment Anything1Billion,而这些图像则从“照片提供商”处购买。但目前还不清楚图片中所描绘的人是否知道他们的图片将被用于这个目的。此外——至少在博客文章中——还不清楚Meta是如何招募注释者团队的,以及他们得到了多少工资。

从历史上看,甚至在今天,许多为AI培训和基准测试标注数据集的注释者来自发展中国家,收入远低于美国的最低工资标准。就在本周,《华盛顿邮报》报道,规模最大、融资最充足的注释公司之一Scale AI向工人支付的工资极低,经常拖欠或扣发工资,并为工人提供寻求救济的渠道很少。

在描述FACET如何诞生的白皮书中,Meta表示注释者是“经过培训的专家”,他们来自包括北美(美国)、拉丁美洲(哥伦比亚)、中东(埃及)、非洲(肯尼亚)、东南亚(菲律宾)和东亚(台湾)等多个地理区域。Meta表示,它使用了来自第三方供应商的“专有注释平台”,并按照每个国家一小时的工资标准向注释者提供报酬。

撇开FACET可能存在问题的出处不谈,Meta表示该基准测试可用于探测不同人口统计属性下的分类、检测、“实例分割”和“视觉基础”模型。

作为测试用例,Meta将其自己的DINOv2计算机视觉算法应用于FACET,该算法已于本周开始商业使用。Meta表示,DINOv2发现了几种偏见,包括对某些性别表现的人的偏见以及对典型地将女性照片识别为“护士”的可能性的偏见。

在博客文章中,Meta写道:“DINOv2预训练数据集的准备过程可能无意中复制了为策展选择的参考数据集中的偏见。我们计划在未来的工作中解决这些潜在的不足之处,并相信基于图像的策展也可以帮助避免因使用搜索引擎或文本监督而产生的潜在偏见。”

没有完美的基准测试。值得称赞的是,Meta承认FACET可能无法充分捕捉现实世界的概念和人口群体。它还指出,由于自FACET创建以来,许多职业形象可能已经发生了变化。例如,在COVID-19大流行期间拍摄的FACET中的大多数医生和护士都佩戴了比大流行前更多的个人防护装备。

在白皮书中,Meta写道:“目前我们不打算更新此数据集。我们将允许用户标记任何可能令人反感的内容,并在发现时删除这些内容。”

除了数据集本身外,Meta还提供了一个基于网络的数据集浏览器工具。要使用该工具和数据集,开发人员必须同意不将其用于训练计算机视觉模型——而只用于评估、测试和基准测试。

举报

  • 相关推荐
  • Lamett乐迈石晶产品硬核测评:零醛、防水、防霉三大指标重新定义健康家

    北京楼市新政落地,市场活力提升,新房装修需求升温。文章重点指出选购健康安全建材的关键指标:甲醛释放量少、防水防潮性强、防霉防蛀能力过硬。通过高温甲醛实验、防水实验和防霉防蛀实验,对比测试了乐迈石晶板等主流建材,结果显示其具有零甲醛释放、滴水不侵、无惧虫霉的优异性能,重新定义了健康建材的标准。

  • Lamett乐迈石晶快装秘籍!让武汉20年老宅“一键焕新”

    武汉黄先生一家140平米老宅经《梦想改造家》节目改造后焕然一新。设计师采用零甲醛添加的Lamett乐迈石晶地板,解决潮湿问题,提升防滑耐磨性能。空间重构实现客卧对调、主卧休闲办公一体化,厨房岛台增进家人互动。全屋原木色调营造温馨氛围,兼顾健康与美学,为五口之家打造安全舒适的生活环境。

  • 7年来首次!苹果罕见发布iOS 26 Beta 9更新

    今日,苹果发布iOS 26开发者预览版Beta 9更新,内部版本号23A5336a。 值得注意的是,这是继2018年iOS 12之后,苹果首次推出第9个测试版更新。 据悉,从iOS 13到iOS 18,苹果在正式版发布前最多只会推出8个测试版,更新节奏一向稳定。 而iOS 12则因频繁修复弹窗问题,一度创下12个测试版的纪录。 根据往年发布节奏,苹果预计将在9月10日发布iOS 26 RC版(准正式版)更新,9月16日发�

  • 带猫环游世界的@不撸猫HaiTang 如何吸引1亿点赞?

    当打工人还在幻想诗和远方,@不撸猫HaiTang 已经带着他的两只狸花猫开始环游世界了! 视频里,这只名为海棠的狸花猫,在菲律宾的划艇上悠闲地打量着海洋;另一段视频中,它又出现在日本北海道的雪景里,好奇地从主人的背包里探出小脑袋。

  • 澎湃OS 3第二批Beta来了!小米回应推送时间

    小米澎湃OS3首批Beta版内测已于8月29日开启推送。 今日,小米澎湃OS官方就大家关心的第二批Beta版(首批Beta版机型)推送时间作出回应。 官方表示,即使推送Beta版本也极为重视交付质量,为了给参与Beta招募的用户提供良好可靠的使用体验,小米社区会按照用户提交招募申请的先后顺序,分两批逐步放量推送,这一举措将提供更充分的质量保障。 当前,由于用户报名热情,�

  • 知名互联网meme原型狗 柴犬PON去世 表情包你用过吗

    日前,网络热门表情包不可以色色”的原型柴犬Pon”被其主人在Instagram上宣布离世,享年17岁。 其主人在ins上用Pon的口吻表示:大家好!非常感谢你们给我的爱,明天11点我将穿过彩虹桥,虽然有点难过,但我的心里充满了幸福,我会带着大家笑容的记忆,踏上全新的旅程你们的邻里偶像PON。” 据了解,PON是一只出生于2008年1月6日的日本埼玉北部柴犬。

  • 15天快装开业,Lamett乐迈石晶地墙品类投资模式解析

    贝壳研究院数据显示,2025年中国存量房装修市场规模将达3.34万亿元,消费者对健康环保、便捷高效的家装需求持续攀升。乐迈石晶作为全球石晶品类开创者,推出"100㎡开店、10余万投资、15天极速开业"轻资产模式,携手经销商掘金"新房整装+旧房改造"市场。其首创的石晶地板和石晶柜板技术,实现从地面材料向墙面、柜体等全屋空间应用的跨越,构建"地墙柜一体化"健康整装系统。凭借"零醛添加、防水防潮"等核心性能优势,石晶材料正加速替代传统建材。目前乐迈石晶在全球拥有10余家工厂及销售机构,业务遍及80多个国家和地区,为高端住宅及商业空间提供整体解决方案。

  • 趣链科技董事长李伟参与2025数博会“DATA之夜”

    8月28日,“2025数博会·DATA之夜”在贵阳举行,主题为“数据筑基,具身向新”。活动由人民网与贵州大数据集团主办,多位政府官员、企业代表及专家学者出席。趣链科技董事长李伟受邀参加,与200余位嘉宾共同探讨数据与具身智能产业融合发展路径。李伟强调AI发展需遵循安全约束,提出借鉴“机器人三定律”构建可信智能生态,并指出区块链、隐私计算等技术可为安全规则执行提供支持。活动为AI时代的系统安全与社会信任提供了新启示。

  • 小米回应升级Beta后手机很烫:系统编译致短期功耗增加

    ​今日,小米正式向8款机型推送澎湃OS3首批Beta版内测更新,涵盖小米15系列(含小米15、15Pro、15S Pro、15Ultra)、REDMI K80系列(K80Pro、K80至尊版)以及小米平板7系列(7Pro、7S Pro12.5)。不过,部分用户在升级后反馈手机出现发热现象,引发关注。 针对这一情况,小米官方在社区问答中回应称,升级后系统需自动对应用进行重新编译,以适配新内存管理机制和运行效率优化。这一后台�

  • 小米澎湃OS 3首批Beta版正式推送!手机、平板8款机型升级

    根据小米社区网友反馈,小米澎湃OS3首批Beta版内测更新目前已开启推送。 有内测资格用户可以点击手机设置-我的设备-击版本号查看是否收到推送。 升级页面显示,小米15 Pro的澎湃OS3Beta安装包大小7.7GB,小米15 Ultra安装包大小9GB。

今日大家都在搜的词: