为了验证,研究者把数据集中的所有证件照以相等的概率随机标记为“正类”(positive)和“负类”(negative),并重做上述实验。结果表明,分类的平均正确率是48 %,正类和负类的错误率分别是 51% 和 50%。 区别特征
研究者接着采取机器学习的方法验证面部特征与犯罪性的关系,其方法是利用特征生成机(Feture Generating Machine,FGM)抓取面部的差别性特征(上图红框区域),比较的特征分别是眼内角间宽 d,鼻唇角角度 θ ,以及嘴角弧度 p。结果如下:
三个判别特征的直方图
三个判别特征 p,直播,d,θ 的平均值和方差 结果显示,犯罪者的鼻唇角角度 θ 的平均值比非犯罪者大 19.6%,而且方差也更大;同样,犯罪者的平均嘴角弧度 p 比非犯罪者大 23.4%,但犯罪者的眼内角间距 d 比非犯罪者的稍小(5.6%)。这些结果证明了面部的区别特征可用于判断人的犯罪性,进一步地,能用于预测一个人是否倾向于犯罪。 结论 研究者在论文的结论中称,“通过多方面的实验和有力的交叉验证,我们证明了通过有监督的机器学习,由数据驱动的人脸分类器能够有效地推断人的犯罪性。此外,我们还发现了非犯罪者的面孔具有常态的规律性(相似性),在控制民族、性别和年龄等因素下,一般守法公民的面部表情比犯罪者的面部表情变化更少。” 讨论 有关这项研究的争论很多,下面从 Hacker News 上选取了几则,也欢迎读者留言讨论。 来自 nl: 当我阅读摘要时,我以为这是在开玩笑,但它看起来确实是一篇论文。尤其是这一段,这是我见过的“研究人员没有理解他们在做什么”的最糟糕的例子之一: “与人类检察官/法官不同,计算机视觉算法或分类器绝对客观,它们没有情绪,没有由于过去的经验、种族、宗教、政治观念、性别、年龄等因素产生的偏见,没有精神疲劳、睡不好、吃不好等先决条件。自动推断犯罪性排除了元精确性(人类检察官/法官的能力)的变数。” 拜托,请读读《数学杀伤性武器》(Weapons of Math Destruction)了解优秀的机器学习是如何发现并利用数据集中的偏见的。 来自 AbrahamParangi : 我同意这种研究是有很长历史的伪科学(例如冥想学),甚至可以说这种研究是不负责任的。但我认为不应过度规定什么是有趣的科学,什么是有用的科学。可能它揭示了一些非常有趣的关系,如果它不做我们就可能错过这些发现。 来自 a_bonobo: 看起来他们没有把两个训练集(犯罪者/非犯罪者)分成两个测试集和训练集? 来自 ongoodie: 总的来说,我认为结果并不令人惊讶。大的遗传偏差会导致行为偏差和面貌的异常。另一方面,这个研究对执法来说毫无用处,因为对一般人来说,大多数看起来像犯罪分子的面孔其实是一般守法公民。但事实是,我们不喜欢这个研究的结果,不代表这个结果就是假的。可以参见第4页看它的验证,他们发现随机对图像进行标记无法产生这样好的分类结果。 Google:用更智能的机器学习对抗歧视 (责任编辑:本港台直播) |