本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

报码:汽车维保反欺诈系统的设计和算法应用(2)

时间:2017-06-06 18:54来源:天下彩论坛 作者:j2开奖直播 点击:
实时自动欺诈预警:使用先进的机器学习技术对于索赔中的索赔类型或零部件组合中不寻常的模式进行定位、对于和客户的维修保养原因不匹配的索赔或者

实时自动欺诈预警:使用先进的机器学习技术对于索赔中的索赔类型或零部件组合中不寻常的模式进行定位、对于和客户的维修保养原因不匹配的索赔或者零件组合进行预警、对于某服务提供商或技术人员的索赔模式与其他服务提供商和技术人员相比明显差异等方面给出迅速综合的判断

  

报码:汽车维保反欺诈系统的设计和算法应用

机器学习的反欺诈算法

鉴于目前国内大多数公司的反欺诈系统应用仍处在初级阶段,缺乏大量的人工验证过的欺诈案例,因此无法满足监督学习(Supervised)算法对基础数据的要求,暂时不适合于普遍应用,因此,本文将着重说明无监督学习(Unsupervised)算法。

汽车厂商的维保管理部门大多会采用标准的零配件和工时费标准,对各类维修赋予固定的工时和零配件价格,甚至采用系统赋值的方式。因此在一般情况下,每次索赔的“金额”一般欺诈的空间较小,而各类维修、零配件的“频率”是反欺诈算法的重点。以下算法旨在关注维保索赔中是否存在异常、欺诈现象,而非针对某个零部件相关的理赔金额判断其是否合理。

这些方法在单独使用时,不能解决所有的欺诈识别需求,实务中会结合多种方法共同使用。例如先按照业务需求将业务数据按照车型、里程、地区、发生时间等维度进行拆分,再使用汇总分析、决策树、聚类分析等方式建立有效的指标监控体系,最后使用机器学习等高级定量分析方法进行实时的预警和科学决策。

异常检测算法 – Benford定律

Benford定律的数据分析遵循一个基本假设:许多现实生活来源的数字列表都是以一种特定的不均匀的方式分布的,大约30%的概率数字1会出现,数字2发生的概率会低于数字1,随后3,4,一直到9,数字9发生的概率低于5%。通过应用Benford定律,可以快速发现人为编造数字的痕迹,从而帮助审查人员缩小调查范围和准确定位调查目标。这种方法适用于欺诈调查的初始阶段,而且易于实现,不需要复杂的算法逻辑。

Benford 算法和一般的统计汇总分析类似,可以在不知从何处入手时,作为初始分析的切入点进行使用,在此不做赘述,下文会着重分享可以系统化自动部署实现的三种算法。

自动算法1:聚类算法 – K Means Clustering

聚类算法通过将数据点分组和聚合成为类似的集群,然后在每个集群内寻找在某种意义上与集群内的其他数据项不同的数据项,从而检测异常数据。这种算法极为适合从非常大的数据集中识别异常数据,例如,识别潜在的欺诈性信用卡交易、潜在欺诈理赔案件、欺诈性风险贷款申请等。在所有的聚类算法中,最广泛使用的算法之一是K Means算法。

K Means 算法通过采用均值算法将数据集分成K个组(组内数据相似,而组间是有差异的),算法流程一般为:

从数据中抽取K个点作为聚类的中心

计算数据中所有的点到这K个点的距离,并将这个点归类到与其最近的聚类里

重新调整聚类中心到每个聚类的几何中心(Euclidean Mean)

重复进行步骤2和3 直到聚类的中心不再移动 - 模型收敛完成

  

报码:汽车维保反欺诈系统的设计和算法应用

为了防止初始聚类中心的选择导致的局部收敛现象,可以采用二分均值算法,通过将全体数据重复进行二分法,选择SSE(Sum of Squared Errors)最小的拆分方式添加聚类分组。

聚类算法的落地应用

每一个数据点与其所在的集群聚类中心的距离越远,意味着其越偏离常规,属于异常的可能性越高。在业务应用中,需要考虑两种应用方式:

若汽车厂商使用反欺诈算法对历史赔案进行离线分析,并且采用人工审核和事后追偿的落地方式,则需要考虑对分析结果进行人工干预和审核的便利性以及历史赔款“追回”的价值。因此需要将所有的异常值判断从“赔案”、“4S店/服务商”、“维修技术人员”等多个维度进行加权,并根据理赔金额的高低进行优先级排序后进行汇总,然后建立相应的审核机制。

若汽车厂商采用的是实时的方式对每个赔案进行打分,并根据分数的高低制定自动规则、系统预警后再进行人工审核的落地方式,则需要在实施应用时建立模型的更新机制,遵循一定的更新频率,从而保证新的欺诈案件和模式能够通过模型的自动学习不断被模型识别。

自动算法2:关联性分析 – Association Rules

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容