说起反欺诈,我们更多想到的是金融领域,其实广义的反欺诈在很多行业都有应用,例如社交中的涉黄,电商中的钓鱼,游戏中自动注册,以及广告投放中的虚假用户等。 DataVisor的CEO兼联合创始人谢映莲有超过十年的安全领域行业经验,并且曾任职于微软研究院,通过许多产品组合作以提高数亿线上用户的安全性。她总结到,反欺诈的核心是身份验证。一则是要判断真实用户有没有不良动机,再则是要判定这个用户能不能变成欺诈用户,从而提前预防。那么衡量标准就是,识别准确,尽量低的漏杀、误杀率,并且发现时间要足够早。 谢映莲强调,在这个过程中,atv,DataVisor的核心算法是无标签无监督的大数据机器学习。 通俗理解,主流方法的逻辑是有标签化的。首先需要知道欺诈者长什么样,打出标签,然后从用户中抓出具有相同标签的人。DataVisor的无标签是通过强关联分析判断的,例如一个羊毛党用户,通常会用同一部手机注册多个账号,那么设备ID就呈现聚合状态,再或者有人批量制造很多虚假用户,那么IP地址可能聚合,等等,而正常用户的这些信息都是分散状态。所以,DataVisor先收集用户脱敏的行为数据,像是注册、登陆、购买、设备ID、IP地址,甚至其他延伸出来的维度,然后进行强关联分析,会发现“坏人的行为都是聚合的,好人的行为都是分散的”,从而进行判断。 这件事情对于计算的复杂性要求较高,因为不是逐个用户去分析,atv,需要同时放在一起看,那么聚合的数据在上亿规模。DataVisor的解决方案是,基于 Apache Spark 搭建,每小时可以对这些网站的数十亿活动日志进行大数据分析,从中识别出是否存在假冒或被盗账号,阻止欺诈、滥用及 SPAM 等行为。此外,如果在现有客户中已经遇到过的聚集,还可以累积成知识库,用来不断训练。 据悉,DataVisor团队有几十人,DataVisor CTO兼联合创始人俞舫在过去十年主攻大数据安全领域,技术总监兼中国区总经理吴中曾就职于微软Bing部门,主攻多媒体图片搜索。2015年10月,DataVisor获得了GSR和NEA领投的1450万美元A轮融资,之后于2016年5月,DataVisor获得元生资本B轮融资。 目前,DataVisor在美国的主要客户包括Yelp、Pinterest等,中国区合作客户包括陌陌、阿里巴巴、猎豹移动、FunPlus、Blued、豆瓣等,客单价在几十万到百万美元之间,已经在全球范围内积累了17亿注册用户的行为数据。 (责任编辑:本港台直播) |