“预测性警务”(被列为“时代周刊”2011 年度50 项最佳发明之一)是此类反馈循环的早期示例。这个想法希望使用机器学习将警察资源分配到可能的犯罪点。因为相信机器学习的客观性,美国几个州实行了这种警务方式。然而,很多人注意到系统正在从以前的数据中学习。如果警方本来在黑人社区的巡逻就超过白人社区,这将导致更多的黑人被捕; 该系统然后进一步学习到,黑人社区更可能发生逮捕,从而加强了原来的人的偏见。这样的系统在实际发生犯罪的地方,并没有导致最佳的监管。 结论 在科学层面上,机器学习可以给我们一个前所未有的自然和人类行为的窗口,让我们内省和系统地分析以前在直觉或群众智慧领域使用的模式。通过这个窗口, Wu 和 Zhang 的研究结果显示了令人尴尬的真相,揭示出我们一直以来是如何判断人的。 在实践层面上,机器学习技术将越来越多地成为我们生活的一部分,像许多强大的工具一样,它们可以而且常常用于良好的应用——包括基于数据更快更公平地做出判断。 机器学习也可能被误用,而这往往是无意的。这种误用往往是源于对技术问题狭隘的偏执,包括: 缺乏对训练数据偏见来源的洞察力; 缺乏对该领域现有研究的仔细审查,特别是在机器学习领域之外; 不考虑可以产生测量相关性的各种因果关系; 不考虑机器学习系统应如何被实际使用,以及在实践中可能有什么社会影响。 Wu 和 Zhang 的论文体现了上述所有陷阱。特别不幸的是,他们测量出的相关性——假设它在更严格的实验条件下仍然很明显——实际上可能是研究机构揭示刑事判决普遍偏见的重要补充。基于表面特征的深度学习,显然不是应该加快刑事司法的工具。这样的做法,比如Faception,将会使不公正永久化。 致谢和注释 致谢—— Charina Choi,谷歌 JasonFriedenfelds, 谷歌 Tobias Weyand,谷歌 Tim Freeman,谷歌 Alison Lentz,谷歌 Jac de Haan,谷歌 MeredithWhittaker, 谷歌 Kathryn Hume, FastForward 实验室 注释 [1]用于测量头骨轮廓的颅形描记器是专门针对这种应用开发的许多仪器之一。 [2]大约在同一时间,一篇关于使用深度学习预测脸部的第一印象的论文,正确地确定了他们正在测量的是主观印象,而不是客观的特征,该论文受到的关注较少。 [3]这种分层结构在大脑的视觉皮质上松散地建模,每个参数对应于突触的强度,或者从一个神经元到另一个神经元的电化学连接。 [4]许多卷积神经网络,包括 ChronoNet,属于深度学习的类别。 “深”意味着有多层连续的操作(因此有许多参数)。 [5]在本文中,性别被模仿为二进制,以基于自我宣称的性别身份为准。 [6]公平地说,这篇论文分析的现实世界快照数据库包括一些模糊的图像,还包括背对的人或戴着大太阳镜的人,以及 ID 照片中没有的其他困难案例。 [7]这让人联想到荷兰学者彼得·坎佩(1722-89)用来“推断”智力的“面角”(Facial angle)测量。 [8]有一些特定的认知障碍会削弱某些人在这项任务中的表现,就像阅读障碍会影响阅读一样。 “脸盲症”可能会影响?2.5%的人口,包括一些令人惊讶的案例,如肖像艺术家 Chuck Close的案例。 [9]机器学习在过去几年中取得的巨大成就,是许多研究实验室经过数十年的努力,使得人脸识别能力得到了很大提高。 [10]新书《面部的价值:第一印象不可抗拒的影响》”的第一章,包括对面相学历史的更完整的评述。 [11]类似的类比思想是“幽默理论”,也起源于希腊,认为血液,痰,黑胆汁和黄胆汁的平衡决定了健康和个性。还有一些仍在使用的英文单词源自这个理论:sanguine(乐观), phlegmatic(冷静), bilious(恶心), choleric(不可理喻), melancholic(忧郁)。 [12]人类的个性“放养”可能意味着什么当然是第二次类比的飞跃。 [13]他的方法和他的分析今天都不会通过。他的测量是有选择性的,他的数据集很小,他的样本有偏差。 (责任编辑:本港台直播) |