根据美国权威汽车维保专刊Warranty Week统计,汽车厂商总收入中的1%-4%(平均2%左右)将作为保修相关的费用支付给经销商和服务商。这部分费用中的15-20%为欺诈费用,而中国的汽车厂商遭受的欺诈案件金额比例可能高达34%。保守估计,主机厂每年因此而承受的损失不低于300亿人民币,而每一家市场份额较高的畅销品牌汽车厂商,在这类欺诈支付上的损失可能超过10亿元/年。 机器学习算法可以通过一系列的汇总、预测和分析算法,将高欺诈嫌疑的案件进行最准确定位和标注。因为不同的车辆类型易损部位存在差异,汽车行驶环境(山路、平原等)带来的差异也可能造成维修信息存在较大不同,因此在把数据交给机器进行汇总归纳之前,需先行将数据进行区分,并根据车型、里程、地区将维修记录进行分组,帮助机器学习算法规避误判,更快更准确地捕捉到维修细节之间的内在关系。 在机器能自动进行“学习”之前,需要将每一条维修记录转换成机器容易读懂理解的形式,也就是将每一条报销理赔记录,故障代码、维修项目细节、零件和工时数等转换成一串“0” 和“1”的记录,这就是矩阵运算中所谓的“高维向量”。下图中的索赔1表示这次维修中更换了密封圈、排气歧管、垫片和冷却器,并产生了机械维修工时。 然后对于每一个标注为“1”的项目,假设其不存在,并用其他所有的信息来“预测”这个项目应该为“1”的可能性(参考算法为稀疏矩阵填充算法等),循环进行计算,直到每一个标注为“1”的记录都计算完成了相应概率。下图中括号里的数字为算法计算的概率。 计算出的概率越低时,则表示这个收费项目在正常情况下存在的可能性越低,也就是欺诈的可能性越大。右侧表格中,“汽车信息计算机”、“助力方向盘”等项目计算的概率得分较低,因此欺诈可能性较高。如果将每项零件工时对应的金额和欺诈概率指数进行加权汇总,则可以在服务商等维度进行汇总,从而将排位较高的索赔案件、服务商进行排序。那些欺诈嫌疑较高且金额较大的主体,就可以成为风险管理部门关注的目标。 当系统部署完成并得到风险管理部门的认可以后,这个系统就可以成为实时动态屏蔽欺诈案件的第一道防线,对于任何一个欺诈嫌疑高、金额较大的案件进行标注和预警。 参考阅读:汽车维保反欺诈系统的设计和算法应用 关于作者: 赵昕,Delta Entropy Technology 七炅科技创始合伙人。曾在四大担任咨询总监,并具有多年的数据分析经验。长期专注于数据分析解决方案,聚焦金融保险和汽车行业。联系邮箱:[email protected] 杨明锋,atv,Delta Entropy Technology 七炅科技创始合伙人。创立Delta Entropy前是美国德勤咨询(Deloitte)和毕马威(KPMG)大数据部门的技术负责人,为诸多世界五百强企业和美国政府机构提供基于大数据和人工智能技术的解决方案。联系邮箱:[email protected] 毛耀鋆,Delta Entropy Technology 七炅科技高级经理,曾任德勤上海精算及保险咨询团队咨询顾问,上海财经大学金融保险统计学士。联系邮箱:[email protected] (责任编辑:本港台直播) |