首页 > 业界 > 关键词  > 算法最新资讯  > 正文

分析称用于建立检测皮肤病的算法的数据集并不包括足够的肤色信息

2021-11-10 09:51 · 稿源: cnbeta

据The Verge报道,根据一项新分析,用于训练检测皮肤问题的算法的公共皮肤图像数据集并不包括足够的肤色信息。而在有肤色信息的数据集中,只有很少的图像是深色皮肤的--因此使用这些数据集建立的算法对非白人来说可能不那么准确。

周二发表在《柳叶刀-数字医疗》上的这项研究检查了21个可自由访问的皮肤状况图像数据集。这些数据集共包含10万多张图片。这些图像中只有1400多张附有关于患者种族的信息,只有2236张有关于肤色的信息。这种数据的缺乏限制了研究人员在图像上训练的算法中发现偏差的能力。而这种算法很可能是有偏见的。在有肤色信息的图像中,只有11张是来自菲茨帕特里克皮肤量表中最深的两个类别的病人,该量表对肤色进行分类。没有来自非洲、非洲-加勒比或南亚背景的病人的图像。

这些结论与9月份发表的一项研究相似,该研究还发现,用于训练皮肤学算法的大多数数据集都没有关于种族或肤色的信息。该研究检查了70项开发或测试算法的研究背后的数据,发现只有7项描述了所用图像中的皮肤类型。

斯坦福大学皮肤病学临床学者、9月份发表的一篇论文的作者Roxana Daneshjou说:“我们从少数报告出肤色分布的论文中看到的是,那些论文确实显示出深肤色的代表不足。”她的论文分析了许多与《柳叶刀》新研究相同的数据集,得出了类似的结论。

当数据集中的图像是公开的,研究人员可以去查看哪些肤色似乎是存在的。但这可能很困难,因为照片可能与现实生活中的肤色不完全一致。“最理想的情况是,在临床就诊时注意到肤色,”Daneshjou说。然后,该患者的皮肤问题的图像可以在进入数据库之前被贴上标签。

如果图像上没有标签,研究人员就不能检查算法,看看它们是否使用了有足够多不同皮肤类型的人的例子的数据集。

仔细检查这些图像集很重要,因为它们经常被用来建立算法,帮助医生诊断病人的皮肤状况,其中一些--如皮肤癌--如果不及早发现就会更危险。如果算法只在浅色皮肤上进行了训练或测试,它们对其他人来说就不会那么准确。"研究表明,只对浅色皮肤类型的人的图像进行训练的程序对深色皮肤的人来说可能不那么准确,反之亦然,"新论文的共同作者、牛津大学的一名研究员David Wen说。

新的图像总是可以被添加到公共数据集中,研究人员希望看到更多关于深色皮肤状况的例子。而提高数据集的透明度和清晰度,将有助于研究人员跟踪更多样化的图像集的进展,这可能导致更公平的AI工具。Daneshjou说:“我希望看到更多的开放数据和更多精心标记的数据。”

举报

  • 相关推荐
  • 微算法科技(NASDAQ:MLGO)研发可信共识算法TCA,解决区块链微服务中的数据一致性与安全挑战

    微算法科技(NASDAQ:MLGO)开发了TCA(可信共识算法),该算法结合可信执行环境(TEE)和有向无环图(DAG)技术,旨在解决区块链微服务架构中的数据一致性和安全性问题。TCA通过引入安全隔离的执行空间确保数据传输完整性,利用DAG结构提高数据处理效率,降低共识延迟和能耗。该技术可广泛应用于金融、供应链管理和物联网领域,实现高效安全的分布式系统。未来随着技术进步,TCA性能将进一步提升,成为构建分布式系统的重要工具。

  • 微算法科技(NASDAQ:MLGO)基于可解释的人工智能技术XAI,增强区块链网络威胁检测的决策能力

    微算科技(NASDAQ:MLGO)创新性地将可解释人工智能(XAI)技术应用于区块链网络安全领域,开发出智能威胁检测系统。该系统通过深度学习模型识别攻击模式,并利用可解释性模块清晰展示决策依据,显著提升了检测准确率和可信度。目前已成功应用于异常交易识别、恶意节点检测和智能合约审计等多个场景,帮助区块链网络实现更高效、透明的安全防护。该技术不仅提高了威胁检测能力,也为后续模型优化提供了依据,未来将在更广泛领域推动构建更安全的网络空间。

  • 过量食用荔枝或引发“荔枝病”:严重时可导致昏迷

    荔枝作为当季的时令水果,吸引了不少市民购买品尝,医生提醒,吃荔枝也得有节制、有讲究,否则有可能患上荔枝病”,给身体带来不适。 据报道,荔枝虽含有大量糖分,但以果糖为主,果糖会刺激胰岛素分泌。当人一次性食用过量荔枝时,大量胰岛素被刺激分泌出来,果糖转变成葡萄糖的速度跟不上,就会导致血糖明显降低,出现低血糖的症状。 一般来说,中度荔枝病�

  • 商汤小浣熊牵手蚂蚁百宝箱,共建AI+数据分析方案

    商汤科技"小浣熊家族"与蚂蚁集团旗下智能体开发平台"蚂蚁百宝箱"达成生态合作,双方将联合打造"AI数据分析助手",为百宝箱用户提供大模型服务。该助手将支持多模态输入,能精准解析用户意图并提供针对性分析建议。目前小浣熊已推出网页版和小程序版,未来将登陆支付宝平台。此次合作将推动AI+数据分析场景落地,后续双方还将共同打造使用教程

  • 睿是信息携手Arctera,深化服务中国市场,共筑数据管理新未来

    2025年6月23日,上海睿是信息科技与全球数据管理领导者Arctera达成战略合作。自7月7日起,睿是信息正式成为Arctera中国区独家总代理,全面负责其在中国市场的运营、销售和技术支持服务。Arctera源自Veritas Technologies,在数据合规、弹性和保护领域具有领先优势。睿是信息作为中国领先的IT服务商,将结合Arctera先进的数据管理解决方案,为中国客户提供更高效可靠的服务,助力企业数字化转型。此次合作将深化双方在中国市场的布局,共同推动数据管理技术创新发展。

  • 强强联手!华沿机器人与基恩士共同赋能工业检测升级

    6月5日,基恩士(KEYENCE)精密测量部门负责人到访华沿机器人,双方就全新"飞扫激光"测量技术展开深度交流。该技术采用电机扫描光切断方式,无需照明和编码器,0.2秒内即可完成尺寸、外观等检测,重复精度达0.3μm。双方在华南国际工业博览会上联合展示了该智能检测方案,吸引众多电子制造行业客户关注。华沿机器人表示,其协作机器人可达到±0.02mm重复定位精度,与基恩士技术完美匹配,能实现1+1>2的效果。未来双方将深化合作,拓展更多行业应用场景。

  • 水滴信用开放平台开放支持企业大数据MCP企业信息查询场景

    水滴信用企业大数据平台拥有覆盖全国3.7亿市场主体的企业信用图谱,提供1000+维度的企业数据查询服务。其核心功能包括:工商注册、股东出资、司法诉讼、经营异常等基础信息实时更新;深度风险扫描涵盖行政处罚、股权冻结等全面监控;商业能力洞察包含知识产权、招投标等实力评估;关系网络透视可穿透至最终自然人。平台已上线火山引擎COZE插件,调用量超8000万次,支持金融风控、供应链管理、政府监管等多场景应用,通过MCP技术实现数据智能融合与深度挖掘,推动企业信息查询从静态检索升级为动态智能洞察。

  • 被狗咬后未就医3个月后发病去世 疾控部门警示狂犬病风险

    ​6月20日,广东省疾病预防控制中心发布通报,近期该省确诊一例狂犬病死亡病例。据调查,患者于数月前被犬只咬伤,伤后未及时前往犬伤门诊进行伤口处理及疫苗接种。涉事犬只在咬人5天后死亡,而患者直至约3个月后出现恐风、狂躁等典型症状,发病3天后陷入深度昏迷,经抢救无效离世。

  • 分析师称MacBook Pro将升级OLED屏:Mini LED退场

    Omdia分析师Linda Lin在一份研究报告中重申,首批搭载OLED屏幕的MacBook将于2026年问世。 尽管她未特别提及MacBook Pro,但业界普遍认为,OLED屏将率先在高端MacBook Pro上首发,随后才会应用到价格更低的MacBook Air系列上。 当前MacBook Pro使用的是Mini LED屏,这块屏升级了液晶层背光,把背光中的LED灯小型化,本质上仍然是LCD屏幕,每个LED灯珠尺寸约在50-200um之间,让背光层拥有更多的背�

  • 2025中国信息通信业发展高层论坛·数据要素产业推进论坛成功召开

    6月10日,2025中国信息通信业发展高层论坛·数据要素产业推进论坛在京举行。论坛聚焦数据要素市场化配置改革,探讨培育数据产业对数字经济发展和新质生产力的重要作用。与会专家指出,数据要素作为新型生产要素,已深度渗透生产、分配、流通、消费各环节,需通过完善产权制度、健全流通机制、强化安全保障等措施释放数据价值。中国联通、烽火通信等企业分享了5G、AI技术与数据要素融合的创新实践,包括智慧城市、应急管理等场景应用。论坛强调要构建"数据资源化-资产化-资本化"发展路径,推动建立全国一体化数据交易市场,为数字中国建设提供基础性战略支撑。