首页 > 业界 > 关键词 > facebook最新资讯 > 正文

Facebook数据集通过让人们自我识别年龄和性别来打击AI偏见

2021-04-09 08:02 · 稿源:cnbeta

Facebook今天开源了一个数据集,旨在体现计算机视觉和音频机器学习模型中的年龄、性别和肤色偏见。该公司声称,这个语料库Casual Conversations,是第一个以付费者为主角的语料库,他们明确提供了自己的年龄和性别,而不是由第三方来标注这些信息或使用模型来估计。

Casual Conversations包含3000名参与者的4100多段视频,其中一些来自Deepfake Detection Challenge,旨在通过加入 "明显 "肤色的标签来对抗这种偏见。Facebook表示,这些色调是用Fitzpatrick量表估算出来的,Fitzpatrick量表是美国皮肤科医生Thomas B. Fitzpatrick在1975年开发的一种肤色分类模式。菲茨帕特里克量表是一种对皮肤类型对紫外线的反应进行概括的方法,从I型(总是灼伤而从不晒黑的苍白皮肤)到VI型(从不灼伤的深色素皮肤)。

Facebook表示,它为Casual Conversations招募了训练有素的注释员,以确定每个参与者的皮肤类型。注释员还为视频标注了环境光照条件,这有助于衡量模特在低光照条件下如何对待不同肤色的人。Facebook的一位发言人通过电子邮件告诉VentureBeat,聘请了一家美国供应商从 "各种背景、种族和性别 "中挑选该项目的注释者。参与者来自亚特兰大、休斯敦、迈阿密、新奥尔良和里士满,并且都获得了报酬。

作为一个领域,工业界和学术专家在理解人工智能的公平性和偏见方面仍然处于早期阶段,人工智能研究界可以将Casual Conversations作为实现亚群体测量和公平性研究正常化的重要基石之一,Facebook表示,通过Casual Conversations,希望能够推动这一重要的新兴领域的进一步研究。为了支持Facebook的观点,有一系列证据表明,计算机视觉模型尤其容易受到有害的、普遍的偏见的影响。科罗拉多大学博尔德分校的研究人员去年秋天的一篇论文证明,亚马逊、Clarifai、微软和其他公司的人工智能对同性男性和女性的准确率保持在95%以上,但有38%的时间会将跨性别男性误认成女性。Gender Shades项目和美国国家标准与技术研究所(NIST)对主要厂商系统的独立基准测试表明,面部识别技术表现出种族和性别偏见,并表明目前的面部识别程序可能会出现疯狂的不准确,在96%以上的时间里误将人分类。

除了面部识别之外,Zoom的虚拟背景和Twitter的自动照片裁剪工具等功能,历来都对皮肤较黑的人不利。早在2015年,一位软件工程师就指出,谷歌照片中的图像识别算法给他的黑人朋友贴上了 "大猩猩 "的标签。而非营利组织AlgorithmWatch显示,谷歌的云视觉API一度自动将深色皮肤的人持有的温度计标注为 "枪",而将浅色皮肤的人持有的温度计标注为 "电子设备"。专家们将这些错误中的许多错误归咎于用于训练模型的数据集的缺陷。

但Casual Conversations远不是一个完美的基准。Facebook表示,它并没有收集参与者的原籍信息。而且在询问他们的性别时,该公司只提供了 "男性"、"女性 "和 "其他 "的选择--没有包括像那些认定为非二元的性别。该发言人还澄清说,从今天起,Casual Conversations只对Facebook团队开放,不会要求员工将其用于评估目的。关于Facebook公平方法的曝光并没有在人工智能社区内产生多少信任。纽约大学在2020年7月发表的一项研究估计,Facebook的机器学习系统每天会犯大约30万个内容修改错误,而且有问题的帖子继续从Facebook的过滤器中溜走。

Facebook方面表示,虽然该公司认为Casual Conversations是 "好的、大胆的 "第一步,但在未来一年左右的时间里,该公司将继续推动开发能够捕捉更多样化的技术,并且希望探索扩大这一数据集的途径,使其更具包容性,其代表性包括更多的地理位置、活动以及更广泛的性别认同和年龄等等。


这篇文章对你有价值吗?

  • 相关推荐
  • 大家在看
  • 字幕投屏、快速出稿 人工智能加成下的会议新模式

    跟随讲话内容实时呈现字幕,这种以前只在视频剪辑才能看到的现象,正在视频会议以及更多的会场上演。字幕以外,会议内容同时会以投屏形式在会场/分会场大屏幕和线上进行呈现,方便所有与会成员准确获取会议信息。这些场景正是人工智能与会议管理相结合的典型案例,是语音识别、语义理解、机器翻译等AI能力的基础应用。精准识别会议内容目前,语音识别技术普遍采用端到端(CTC)语音识别框架和端点检测(VAD)技术,搭配基于Attenti

  • 戴尔科技集团发布面向人工智能和边缘计算的新一代PowerEdge服务器

    戴尔科技集团(NYSE:DELL)宣布推出新一代更强大、更安全的戴尔易安信PowerEdge服务器。借助这些全新服务器,戴尔正在成就一条通往自主基础设施的道路,旨在提高IT效率、拥抱人工智能并满足边缘的IT需求。从核心数据中心到公有云和边缘位置,无论数据存储在哪里,这个全球销量领先的服务器产品系列 2 都能提供强大的功能,帮助客户从这些数据中获取实时洞察并进行数据处理。这 17 款全新的PowerEdge服务器融入了 1100 项戴尔已经?

  • 孩子天天和题海文山做斗争?栗志AI人工智能题库火速上线!

    相信当今在很多家庭都存在这样一个问题,孩子天天和题海文山做斗争,成绩却一如既往地提不上去,为什么会出现这种情况呢?众所周知,孩子刷题的意义不在于数字上的充量,而是适合孩子学习情况的针对性提升。为了解决绝大多数家庭的烦恼,减轻孩子的学习压力,节省孩子的学习时间,栗志AI人工智能题库火速上线!其优势在于帮助孩子循序渐进地适量刷题,为孩子量身定制个性化的智能题库。假设孩子目前的成绩是 70 分,栗志AI人工智能

  • AI助力宫颈癌筛查技术提升,人工智能为健康保驾护航

    宫颈癌是中国第一大妇科恶性肿瘤,是我国和全球面临的主要公共问题之一。我国每年死于宫颈癌的女性多达5.3万人,70%-80%女性一生中都会感染HPV病毒,90%以上的宫颈癌伴有HPV病毒感染,消除宫颈癌成为全世界的期望。在2020年的两会上,多位代表和委员呼吁尽快实现我国适龄女孩HPV疫苗国家计划免疫接种(免费接种)。2月10日,国家卫健委回复称,对HPV疫苗接种纳入国家免疫规划进行统筹研究,逐步推广适龄人群HPV疫苗接种。预防宫颈?

  • AI 落后要挨打的苹果,5 年疯狂收购 25 家人工智能公司!

    据外媒消息,过去5年中,苹果公司在收购人工智能公司数量上排名第一。根据Globaldata的交易数据显示,2016年~2020年人工智能技术领域的并购交易格局由美国科技巨头主导,在人工智能领域最大的5家收购方中,有4家总部都在美国:苹果、谷歌、微软、Facebook。

  • 容联云与南开大学联合论文被人工智能国际顶会AAAI收录

    近日,人工智能领域的全球顶级学术会议AAAI公布了2021年论文录用结果,容联云人工智能实验室(Cloopen Research)与南开大学的联合研究成果提出了基于双向阅读理解框架的情感三元组抽取模型,联合论文《Bidirectional Machine Reading Comprehension for Aspect Sentiment Triplet Extraction》已被AAAI 2021收录。AAAI会议由国际人工智能促进协会主办,被中国计算机学会列为A类会议,是业界广泛认可的顶级AI学术盛会。AAAI 2021投

  • 布局人工智能发展 2021宝德AI百城巡展启航圆满举行

    2021 年 3 月 10 日,“人工智能构建中国双循环发展新格局—— 2021 宝德AI百城巡展启航”活动在深圳大中华喜来登酒店隆重召开。中国领先的IT产品和解决方案提供商——宝德,携手华为和各领域的技术精英,共同探讨智能时代的创新技术和应用趋势,以及对中国双循环经济格局的贡献。深圳市人工智能行业协会执行会长郎丽艳深圳市人工智能行业协会执行会长郎丽艳率先致词。她说,自我国正式将人工智能提升到国家级战略以来,人工智能在

  • 人走茶凉?Facebook将删除所有带特朗普声音的内容

    当地时间3月31日,Facebook删除了一段特朗普的采访视频,并表示该平台和Instagram上发布的“带有特朗普声音”的内容都将被删除。

  • 鼎茂科技-上海人工智能研究院AIOps联合实验室成立

    3 月 30 日,鼎茂科技与上海人工智能研究院在上海真如城市副中心举行了战略合作签约仪式,成立【智能运维AIOps联合实验室】,共同加速推动AIOps产学研用一体化发展。AIOps正在逐渐成为中国企业数字化发展道路上的重点需求,但算法建模中参数调整的复杂性和反复性;功能设计对于运维实际场景的贴合度,以及工程化水平的技术门槛,是AIOps能力对各行业产生价值所必须攻克的难点,鼎茂科技与研究院将利用各自的优势和协同的效能,依托?

  • Facebook首席营收官宣布离职,未来不再设立该职位

    据了解,Fischer 为 Facebook 工作11年,此前一直负责 Facebook 的广告业务和全球销售组织。在加入 Facebook 之前,Fischer 曾担任谷歌全球在线销售和运营副总裁。据 Fischer 表示,他将会在离职后和朋友与家人共度一段时光。Facebook 表示将会增加一个首席商务官职位,由 Fischer 负责寻找继任者。

  • 高额奖池、院士评定,首届全球人工智能技术创新大赛开启征召!

    随着新一轮科技革命和产业变革的来临,产业智能化升级与转型正迈进新的加速阶段。积淀的AI技术如何下沉到行业,如何构建良好的智能发展生态,如何在更深刻的层面影响大众生活,成为了当前关键问题。在过去十几年的AI浪潮中,计算机视觉与自然语言处理技术的突破,为各行各业的发展带来了新的潜力。如今随着AI技术突破的放缓,我们需要认真思考,如何将这些技术突破应用金融、医疗、汽车、手机等各个领域,通过不断的开拓、创新,推动产业智能

  • 搜狗获颁2021年度人工智能卓越奖:用AI技术谱写行业新蓝图

    北京时间3月29日晚,搜狗公司荣膺由商业智能集团(Business Intelligence Group)颁发的“2021年度人工智能卓越奖”,AI技术及应用能力再获国际认可。 与其他行业奖项不同,商业智能集团的奖项均由具有丰富从业经验与行业知识的企业高管评判选出;其独一无二的计分体系,可综合衡量入围企业在多个业务领域的表现,旨在表彰将人工智能带入生活并应用其解决实际问题的企业、产品及个人。历届上榜企业中包含了如IBM、江森自控在内的多家

  • 消息称滴滴自动驾驶拟筹资至多5亿美元 用于投资人工智能芯片等

    有知情人士透露,滴滴出行旗下滴滴自动驾驶计划筹资至多5亿美元,筹得的新款项将帮助滴滴加速自动驾驶汽车的大规模生产,并投资于人工智能芯片等技术。对此,滴滴方面不予置评。

  • Facebook计划于5月10日开始重新开放办公室

    据《旧金山纪事报》此前报道,如果当地新冠确诊病例数继续下降,Facebook确认计划于5月10日以10%容量重新开放其加州门洛帕克总部的办公室。该社交网络在加州弗里蒙特的办公室将于5月17日跟进,加州森尼韦尔的办公室将于5月24日跟进,旧金山市中心的办公室将于6月7日跟进。

  • Facebook意外放行了“Clubhouse PC版”的假冒网站广告

    迄今为止,主打实时语音聊天社区的 Clubhouse 仅专注于 iOS 移动平台。但是对于不知情的网友来说,很可能在浏览 Facebook 时被假冒“Clubhouse PC 版”的李鬼网站给欺骗。早些时候,社交网络巨头意外放行了这则违规广告。虽然发布者精心制作了仿冒网站,但实际下载下来的却是包含恶意软件的“Clubhouse PC 版”安装包。李鬼网站沙箱分析表明,在恶意软件被打开后,它将尝试与命令控制服务器进行通信,以获取下一步操作指令,比如悄

  • Facebook为帖文增加小标签 希望让用户不再把讽刺和现实混为一谈

    Facebook正在为出现在用户News Feeds中的Pages的帖子增加额外的标签,以减少对其来源的混淆。这些标签将包括 "公职人员"、"粉丝页面"和 "讽刺页面"。该公司表示,已经开始在美国测试这些标签的部署,并将逐步在更多的帖子中加入这些标签。对于为什么要添加这些标签,Facebook没有给出任何解释,但识别讽刺似乎尤为重要。看看洋葱网或巴比伦蜜蜂网等知名讽刺网站撰写的搞笑文章的社交分享,你会发现有很多人对这些故事信以为真。在?

  • 2021年人工智能全球最具影响力学者榜单AI2000发布

    4月8日,2021年人工智能全球最具影响力学者——AI 2000 榜单重磅揭晓。 AI 2000 榜单由清华大学AMiner联合北京智源研究院、清华-中国工程院知识智能联合研究中心共同发布,旨在通过AMiner学术数据在全球范围内遴选过去十年人工智能学科最有影响力、最具活力的顶级学者。通过跟踪全球人工智能领域学者2010年到2020年的论文发表情况,用计算机算法自动生成榜单排名,确保了榜单的客观、公正。 AI 2000 榜单涵盖人工智能学科20个子领

  • [图]皮尤社交媒体报告:YouTube和Facebook仍是美国主流

    根据皮尤公布的最新调查报告,虽然美国公众对社交媒体存在各种消极、负面情绪,但将近 70% 的美国人表示曾使用或正在使用社交媒体,这个数字在过去 5 年来基本保持稳定。虽然备受争议,Facebook 依然是美国人每天使用最频繁的社交媒体平台。在这份《Social Media Use in 2021》报告中,皮尤采访了 1502 名美国人,了解他们的社交媒体习惯,概述了社交媒体平台使用的主要趋势和转变。而鉴于过去 12 个月里发生的诸多事情,大多数平?

  • Facebook用户信息遭泄露 涉及5.33亿用户

    据媒体报道,美国知名社交媒体平台脸书(Facebook)有5.33亿用户数据遭泄露,其中包含一些知名人士的信息。报道称一个低级别的黑客论坛3日曝光了5.33亿脸书用户的个人数据,这些用户涉及106个国家和地区,泄露的信息包括用户在脸书的账户名、位置、生日以及电子邮件地址等。

  • Facebook 正在开发全新社交网站「Hotline(热线)」

    Hotline来自Facebook内部一个名为新产品实验(NPE)团队的小组,该小组的任务是从头开始打造小型社交媒体应用程序。Facebook的一位发言人说,Hotline的目标是让「知识专家」们可以分享来自金融或健康等不同领域的信息。她说,研究小组正在探索用户的问题是如何被「投票」的。目前,Hotline没有任何访问群体大小限制,主持人可以删除问题,Facebook表示,目前处于早期测试中,还正在调整不适当的内容。

  • 热门标签

热文

  • 3 天
  • 7天