:COO、执行总编、主编、高级编译、主笔、运营总监、客户经理、咨询总监、行政助理等 9 大岗位全面开放。 简历投递:j[email protected] HR 微信:13552313024 新智元为COO和执行总编提供最高超百万的年薪激励;为骨干员工提供最完整的培训体系、高于业界平均水平的工资和奖金。 加盟新智元,与人工智能业界领袖携手改变世界。 【新智元导读】上海交通大学的两位研究者武筱林与张熙的一项题为“利用脸部照片自动推断犯罪性”的研究,利用基于有监督的机器学习的方法,用 1856 张真实的人的脸部照片建立四个分类器(逻辑回归,KNN,SVM,CNN),根据人的脸部特征预测一个人是否有犯罪倾向,并评估这些分类器的表现。Google 博客文章《用更智能的机器学习打击歧视》提出改进机器学习系统来避免歧视,认为优化“机会均等”只是可用于改进机器学习系统的许多工具中的一个,而数学本身不可能得到最好的解决方案。对抗机器学习中的歧视问题需要仔细、多学科结合的方法。 最近,上海交通大学的两位研究者武筱林与张熙的一项题为“利用脸部照片自动推断犯罪性”(Automated Inference on Criminality using Face Images)的研究,试图利用基于机器学习的分类器模型充当 dominator,根据人的脸部特征预测一个人是否有犯罪倾向。研究者称“四个分类器(逻辑回归,KNN,SVM,CNN)都表现良好,为根据脸部特征自动预测犯罪性(criminality)提供了有效性证据”,并且“发现了一些可以预测犯罪性的结构上的区别特征,例如嘴角的弧度、眼内角间宽、以及所谓的鼻唇角角度”。研究者认为“不同于人类法官,计算机视觉算法/分类器不会有歧视,不会受到情绪、宗教、性别等因素的影响,因此具有客观性上的优势”。这项研究引起了相当多的讨论。 论文摘要 我们首次进行基于静止的人脸图像自动推测犯罪性的研究。通过有监督机器学习,我们使用 1856 张真实的人的面部照片建四个分类器(逻辑回归,KNN,SVM,CNN),这些人中有近一半是已被定罪的犯罪者,其余是非犯罪者,我们以民族、性别、年龄和面部表情作为控制要素,让计算机区分犯罪者和非犯罪者。四个分类器都表现良好,为根据脸部特征自动预测犯罪性提供了有效性证据,尽管围绕该主题存在历史性争议。此外,我们发现一些可以预测犯罪性的结构上的区别特征,例如嘴角的弧度、眼内角间宽、以及所谓的鼻唇角角度。这项研究最重要的发现是,犯罪者和非犯罪者的面部照片在表情的多样性方面非常不同。犯罪者的面部表情变化明显大于非犯罪者。由两组照片组成的两个流形看起来是同心的,非犯罪者的流形的跨度较小,表现出正常的规律。换句话说,一般守法公民的面貌与犯罪者的面貌相比具有更大程度上的相似性,也就是说,犯罪分子在面部表情上的差异比普通人更大。 数据准备 研究者收集了 1856 个人的证件照,他们都满足以下条件:中国人,男性,年龄在 18 至 55 周岁,没有胡子,脸上没有伤疤或其他标记。研究者把这个数据集标记为 S,再把它分为两个子数据集 Sc 和 Sn,Sc 代表犯罪者,Sn 代表非犯罪者。其中 Sn 包含 1126 张普通人的证件照,Sc 包含 730 张犯罪者(包括 330 张被通缉逃犯)的证件照。
数据集中的样本证件照 研究方法:四种分类器模型 为了使研究尽可能考虑周到,研究者对前述证件照数据集使用了四种分类器方法,分别是 K-最近邻法(K-Nearest Neighbor,KNN)、逻辑回归(Logistic Regression)、支持向量机(Support Vector Machine,SVM)以及卷积神经网络(Convolutional Neural Network,CNN)。 对前三种分类器,研究者比较了它们在较广泛的特征上的表现,包括:1. 面部标志点,例如眼角、嘴角、鼻尖等;2. 由 PCA 模块生成的面部特征向量;3. 基于局部二值模式(LBP)的面部特征向量;4. 上述三者的结合。CNN 是没有明显特征向量的数据驱动的分类方法。对上述所有分类器,采用了一共十三个交叉验证(3 种分类器 × 4 种向量特征,再加上 CNN),每个 10 次运行一共 130 次实验(13 cases × 10 runs),验证的结果采用平均值。 结果
四个分类器在 13 次交叉验证中的正确率
误判率
四个分类器的总体正确率 上图分别显示了四个分类器的总体正确率和误判率,可以看到,CNN 在交叉验证中的分类正确率最高,达到 89.51%。 验证 (责任编辑:本港台直播) |