本港台开奖现场直播 j2开奖直播报码现场
当前位置: 新闻频道 > IT新闻 >

“角色扮演”骗贷款:如何揪出一个不还钱的骗子(2)

时间:2017-07-03 11:24来源:本港台现场报码 作者:www.wzatv.cc 点击:
他们可能只需要一张身份证照片,一些简单的个人信息,就可以获得一个贷款“客户”。但是,这个“客户”是否真的会还款?是否要把这笔款贷给这个“

他们可能只需要一张身份证照片,一些简单的个人信息,就可以获得一个贷款“客户”。但是,这个“客户”是否真的会还款?是否要把这笔款贷给这个“客户”?平台想要知道这些问题的答案,这就是猛犸要解决的问题之一。

平台当然也不傻,线上生意做久了,总会有大量的数据产生。

你可能理所当然的想:大量的数据会产生用户画像,从而不就确定了一个人的还款能力?

“角色扮演”骗贷款:如何揪出一个不还钱的骗子

话都让你这么说了我特么还说啥

事实上,平台比谁都想提高风控能力,但现实很骨感。大量的数据产生后,平台面临了这些问题:

1.业务量大,产生的数据量很大,j2直播,处理起来很麻烦,怎么知道哪些有用,哪些没用?

2.获得的数据中,非结构化数据混在其中,一般人无法处理,需要大量数据专家。

3.碰上专业的欺诈团伙,你怎么办?比如,门店提供贷款买手机业务,销售员却贴了大大的标语:助贷。销售员和顾客合伙骗贷怎么办?

要回答这些问题,首先要知道“谁是谁”。

比如,在线上贷款中,一类现象十分严重:盗用用户信息进行贷款。

“在一项交易进行时,会产生一堆的联系点,比如,我用我的手机发起转帐交易时,转了多少钱?转给谁?在哪个 IP 地址发起的交易?都是联系点。在不同的地方、不同的IP地址,我都可能发起不同的交易。所以,我认为数字化业务的核心是做数据平台时,以人、设备和账户为核心,建立整体的数据平台,在这个基础之上,再去做分析、大数据、机器学习。”张克说。

猛犸本身不产生数据,也没有削尖脑袋想钻进数据江湖。

按照张克的说法,创业公司冲进这个领域要面对艰难的竞争,还不如做好手头的技术,因此,他们与诸葛io、talkingdata 等公司合作,引进第三方数据,同时把自己的技术下沉到每一个客户的应用中,梳理基于他们的应用收集的数据。

专心打造一项技术,让自己足够强,强到与客户的应用相匹配时,可以像一股细细涓流,丝毫不产生震荡的影响,这就是猛犸的策略之一。

在费心竭力地搜集终端、用户、账户、业务和第三方数据后,还有关键的一步是让数据“说同一种语言”。因此要对数据进行整理,实现语义的统一,再在感知能力这一块,对设备、渠道、用户、产品和交易之间的关联进行特征抽取与建模。

“在机器学习里,如果机器学习是一个金字塔,塔尖是模型和结论,效果却是由塔的基座(数据)来决定。数据基础决定效果,上面的模型都是尽量接近塔尖――所能够预设的天花板而已。”张克冷静而克制,他并不迷恋一座宏伟的金字塔塔尖的登顶,而是清晰地看到什么是基础,到底每一层能发挥什么作用,而自己又能看到怎样的风景。

“角色扮演”骗贷款:如何揪出一个不还钱的骗子

那么,到底是什么在支撑猛犸进行智能风控?张克介绍:

第一,IT系统。现在业务迁移到互联网,最基础的是要知道做业务的现场是什么?如果犯罪了,要知道犯罪现场,交易则要知道设备现场。

张克称【新葡京官网】,猛犸的设备指纹技术与其他厂家相比,并非做做主动式指纹,而是做被动式指纹。

被动式指纹的优点在于能打通微信,比如,用微信、内嵌浏览器访问一个服务,其他厂家无法识别是否来自于同一个设备,但是被动式指纹都能够打通。一旦打通,就可以更好地建立顶层数据集。

第二,异常检测。猛犸把它分成四类,做了四种不同的计算框架,只要客户提出来,最少一天,最多一周,就能根据业务需要、业务场景把新的计算工程放进去,然后检查用户行为异常。

在异常检测上,猛犸做了统一量纲。如果一个人一天登录了十次,数值有异常,这是一个特征。还有一种场景是:同样一个人,两次交易之间相隔了一小时,但地理位置相隔了一千公里,这个也是异常特征。

但是以上层模型用的这两个异常特征其实风马牛不相及,根本不是在一个框架里面讨论问题。异常统一量纲后,根据概率分布,猛犸分析出来的结果是,所有的分布都在1和1000之间,用起来非常简单,这种模型对使用便利性而言,是巨大的提升。

还有一个好处是冷启动,你做模型时经常碰到一个问题:如果不给我数据,怎样才能试出一个可用的模型?

(责任编辑:本港台直播)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
栏目列表
推荐内容