谷歌正在寻找一种新方法来对肤色进行分类以抑制产品中的偏见
Alphabet Inc 的谷歌本周告诉路透社,它正在开发一种替代行业标准的肤色分类方法,越来越多的技术研究人员和皮肤科医生表示,这种方法不足以评估产品是否对有色人种有偏见。
有争议的是一种称为菲茨帕特里克皮肤类型 (FST) 的六色标度,皮肤科医生自 1970 年代以来一直在使用它。科技公司现在依靠它来对人进行分类,并衡量面部识别系统或智能手表心率传感器等产品在不同肤色上的表现是否同样出色。
批评者说,FST 包括四个类别的“白”皮肤和一个“黑色”和“棕色”皮肤,无视有色人种之间的多样性。美国国土安全部的研究人员在去年 10 月的联邦技术标准会议上建议放弃 FST 来评估面部识别,因为它不能很好地代表不同人群的颜色范围。
在回答路透社关于 FST 的问题时,谷歌首次并领先于同行表示,它一直在悄悄地寻求更好的措施。
该公司表示:“我们正在研究可能对我们的产品开发有用的替代性、更具包容性的措施,并将与科学和医学专家以及与有色人种社区合作的团体合作,”该公司表示,但拒绝提供细节在努力上。
这场争议是科技行业对种族主义和多样性的更大清算的一部分,科技行业的劳动力比金融等行业的白人更多。随着通常由人工智能 (AI) 提供支持的新产品扩展到医疗保健和执法等敏感和受监管领域,确保技术适用于所有肤色以及不同年龄和性别的重要性越来越大。
公司知道,对于在研究和测试数据中代表性不足的群体,他们的产品可能会出现问题。对 FST 的担忧在于,它对深色皮肤的有限规模可能会导致技术的出现,例如,适用于金棕色皮肤但不适用于浓咖啡红色调。
许多类型的产品提供比 FST 丰富得多的调色板。Crayola 去年推出了 24 款肤色蜡笔,今年美泰的芭比时尚达人娃娃涵盖了 9 种色调。
对于谷歌来说,这个问题远非学术性的。当该公司在 2 月份宣布某些 Android 手机上的摄像头可以通过指尖测量脉搏率时,它表示无论用户的皮肤是浅色还是深色,读数平均都会误差 1.8%。
该公司后来提供了类似的保证,即皮肤类型不会显着影响 Meet 视频会议中过滤背景的功能的结果,也不会影响即将推出的用于识别皮肤状况的网络工具(非正式地称为Derm Assist)。这些结论来自于六音 FST 的测试。
初始点
已故哈佛大学皮肤科医生 Thomas Fitzpatrick 博士发明了该量表,用于个性化紫外线辐射治疗银屑病,这是一种皮肤发痒的疾病。他通过询问他们在阳光下经过一段时间后晒伤或晒黑的程度,将“白人”的皮肤分组为罗马数字 I 到 IV。
十年后出现了代表“棕色”皮肤的 V 型和代表“黑色”的 VI。该量表仍然是美国测试防晒产品法规的一部分,它仍然是评估患者癌症风险等的流行皮肤病学标准。
一些皮肤科医生表示,该量表是一种糟糕且过度使用的护理措施,并且经常与种族和民族混为一谈。
“很多人会认为我是 V 型皮肤,这种皮肤很少甚至永远不会灼伤,但我会灼伤,”宾夕法尼亚大学皮肤科医生 Susan Taylor 博士说,他于 2004 年创立了 Skin of Color Society 以促进对边缘化社区的研究。“看我的肤色就说我是 V 型对我不利。”
直到最近,科技公司才对此漠不关心。Unicode 是一个监督表情符号的行业协会,在 2014 年将 FST 称为采用黄色以外的五种肤色的基础,称该比例“没有负面关联”。
2018 年一项名为“性别阴影”的研究发现,面部分析系统更容易误判肤色较深的人,并使用 FST 来评估人工智能。该研究将 FST 描述为“起点”,但后来进行类似研究的科学家告诉路透社,他们使用该量表来保持一致。
“作为针对相对不成熟市场的第一个措施,它的目的是帮助我们识别危险信号,”专注于审计 AI 的 Mozilla 研究员 Inioluwa Deborah Raji 说。
在 4 月份的一项测试人工智能检测深度伪造的研究中,Facebook Inc 的研究人员写道,FST“显然不包括棕色和黑色肤色的多样性。”尽管如此,他们还是发布了 3,000 个人的视频,用于评估人工智能系统,并根据八位人类评估者的评估附加了 FST 标签。
评估者的判断是核心。面部识别软件初创公司 AnyVision 去年向评分者提供了名人示例:前棒球巨星德里克·杰特 (Derek Jeter) 是 IV 型,泰拉班克斯 (Tyra Banks) 是 V,说唱歌手 50 Cent (50 Cent) 是 VI。
AnyVision 告诉路透社,它同意谷歌重新考虑使用 FST 的决定,Facebook 表示愿意采取更好的措施。微软和智能手表制造商 Apple 和 Garmin 在开发与健康相关的传感器时参考了 FST。
但是,受 Black Lives Matter 社会平等运动的启发,加州大学圣地亚哥分校的临床医生去年在《睡眠》杂志上写道,使用 FST 可能会助长对深色皮肤上智能手表的心率读数的“错误保证”。
微软承认 FST 的缺陷。苹果公司表示,它使用各种措施对不同肤色的人类进行测试,其中 FST 只是有时。Garmin 表示,由于进行了广泛的测试,它认为读数是可靠的。
创立化妆公司 Mob Beauty 并帮助 Crayola 开发新蜡笔的 Victor Casale 说,他为粉底开发了 40 种色调,每种色调与下一种色调相差约 3%,足以让大多数成年人区分。
他说,电子产品的色彩准确度表明技术标准应该有 12 到 18 种色调,“你不能只有 6 种色调。”