关联性分析中最广为流传的一个应用就是沃尔玛的“尿布和啤酒”案例。关联性分析除了在零售行业的客户偏好方面的应用之外,也可以直接应用于维保领域的反欺诈分析。每一次维修中涉及到的零配件的类别和数量与每一次维修的特征相关,因此可以根据每一次维修中涉及到的零配件之间共同出现的情况,对某一个索赔维修中是否有不常见的组合进行识别。这种方法和其他的反欺诈算法一样,需要作为很多工具中的一个,用于定位识别欺诈案件。 例如:一般在维修中,通过关联性分析可以发现,排气歧管、密封圈垫一般是成对同时出现的;而喇叭的维修一般不会和排气歧管、密封圈垫的更换发生在同一个维修中。通过关联性分析规则,可以将排气歧管、密封圈垫和汽车喇叭的维修发生在同一次维修的索赔进行标注。这种现象本身不一定说明这个索赔一定是欺诈,但是如果通过汇总分析,同时发现这个服务商的汽车喇叭维修次数明显高于其他服务商的平均水平,则可以对这个服务商的喇叭维修进行关注和审核了。 自动算法3:实时欺诈预警算法 – Delta Detection 笔者所在的公司的维保反欺诈系统Delta Detection是七炅科技自主开发的维保反欺诈系统,其核心算法基于大数据分析挖掘海量索赔单中不同理赔科目(零部件、工时、索赔类型等)之间的隐含关系,并以此推导出各个索赔科目的存在合理性。该算法曾在美国大数据算法大赛中获得最佳效果。在医疗保险和汽车保险反欺诈领域的得到了广泛应用。其算法流程如下: 分析并汇总每一条索赔记录中的零配件维修代码,结合时间、车型、服务商4S店特征等信息,将每一条报销索赔记录转换成一个高维向量 对于新的报销索赔记录,利用稀疏矩阵填充算法,对已申请索赔的每一个项目进行评估打分 如果一个项目得分很低,则该项目有可能是异常维保索赔项目。得分越低,atv直播,则欺诈可能性越高 将得分低的项目对应的欺诈可能性指数与该项所对应的金额相乘,加权后根据业务应用的需要,在每个赔案(或者服务商在某个时间段的所有赔案)层面汇总。 根据业务需要和应用目的,同时考虑误判率高低的影响,制定出欺诈标识对应的标准和规则,然后将判断为欺诈的赔案(或者服务商)进行系统推送和预警 通过真实保险数据的验证,该算法对于欺诈案件的识别成功率极高,而且普遍应用与医疗保险、汽车维修保养欺诈、汽车保险欺诈等领域。 Delta Detection应用实例 :汽车维保反欺诈 操作流程: 根据车型、里程、地区将维修记录进行分组(分组决策可以参考决策树分组等变量重要性筛选工具的结果),然后对每一组数据进行独立分析 汇总分析每一条维修报销理赔记录,结合故障代码和维修项目细节与工时类别,将每一条申报记录(零件个数和工时数)转换成一个高维向量 利用Delta Detection算法和维修项目的内在关系,计算各项指标的出现概率,概率越低,表示欺诈的可能性越大。下面表格中,“汽车信息计算机”、“助力方向盘”等项目计算的概率得分较低,因此欺诈可能性较高 生成欺诈概率指数(1-概率),并将每项零件工时对应的金额和欺诈概率指数进行加权汇总,在服务商、维修员工、录单员等维度进行汇总 汇总后排位较高的索赔案件、服务商、维修员工、录单员成为风险管理部门关注的目标
Delta Detection应用实例:医疗过度收费/欺诈报销 操作流程: 分析并汇总每一条医疗账单记录中的ICD和CPT代码,结合时间、地点、患者的个人背景信息和病史,将每一条报销记录转换成一个高维向量 对于新的报销记录,利用Delta Detection稀疏矩阵填充算法,对已报销的每一个项目进行评估打分 如果一个报销项目的得分很低,则该项目有可能是过度治疗/过度报销的收费 右图中,报销2中“麻药注射”只有0.04的得分,因此很可能是一个过度治疗/过度报销的项目 生成欺诈概率指数(1-概率),并将每项代码对应的金额和欺诈概率指数进行加权汇总,在医院、诊所、医生的维度进行汇总 汇总后排位较高的报销、医院、诊所、医生成为风险管理部门关注的目标 (责任编辑:本港台直播) |