一单价值十个亿的买卖,和十单各自价值一个亿的买卖,创业者会如何选择?或许一些创业者认为,前者都是最优选:省力又省事,还不耽误赚钱。而智融集团CEO焦可却不这么想。“相比每个月放了多少钱,我们更在意每个月放了多少笔款项。”焦可说,“对我们而言,样本量比短期商业获益来得重要。” 这一观点,体现了智融集团的商业模式核心要义——通过人工智能打造金融界的“最强大脑”。智融集团专注于研发以人工智能为核心的新金融技术,通过与持牌金融机构紧密合作,为之提供获客、风控及信贷过程管理相关的服务。 大数据爆发:挖掘冰山之下的价值 目前,中国进入数据爆发的时代,传统金融机构赖以风控的强特征数据仅是所有可利用数据的冰山一角。 “美国市场银行可以满足70%的贷款需求,而国内这个数字只有15%。”焦可认为这其中的原因除了数据量体的差别更深层次的原因在于,银行过去放贷主要依赖强特征进行风控,所谓强特征是指可以凭借一条或几条信息即可决定是否放贷的重要特征,例如名下是否有房产,有的借贷产品基本有房产即可放贷,没有则不可,其他的强特征还有信用卡账单、社保公积金缴纳记录等。 且强特征数据这“冰山一角”本身也不够完善。以申请信用卡为例,如果申请人的收入是以现金形式发放,没有银行流水可以证明其收入情况,那么,申请人极有可能面临被拒的结果。再进一步深想,这些信息是不是真的能够反映真实的信用情况?几十个数据是否就足够反映信用情况?除了这些信息之外,有没有其他信息和个人信用有着强关联? 在互联网时代以前,这些问题无从验证。但是,移动互联网产生了大量弱特征的数据,例如位置、购物习惯、社交等等,这些数据虽然有价值,但是无法凭借其中的少数几条就做出借贷决定,不过如果把几百上千个维度这样的数据综合起来,就可以训练出有效的风控模型。 “综合处理几百上千个弱特征,人力是无法做到的,需要用到大数据处理技术和机器学习的方法,而这正是我们所擅长的。”焦可说。通过人工智能强大的统计能力和运算能力,atv直播,智融集团将弱特征数据的价值深度挖掘和利用,从而让个人信用的“冰山”全貌浮出水面。 人工智能:实现马太效应正循环 据悉,智融集团弱特征数据源头包括四个方面:其一,用户提交的数据;其二,用户提交过程中的行为数据;第三,用户所授权使用的数据,例如运营商数据、GPS等;其四,用户在APP上所积累的数据。 然而在焦可看来,atv,获取数据只是“买菜”的过程,接下来如何用好大数据进行“炒菜”才是行业比拼的关键。焦可认为,“炒菜”的关键点是对海量数据特征点的挖掘。智融集团平均每天可采集5-6万个样本并在不断增长,每个样本数据有1200个以上维度的特征点,这就意味着,其旗下的I.C.E.人工智能风控引擎每天会有6000-7000万个左右的特征点进行模型训练。 这些海量的弱数据将成为智融集团人工智能之路的一颗颗鹅卵石,获取的数据越多,人工智能风控系统的精度就越高,呈指数级增长。然而,人无法操作如此数量级的数据分析,也没有能力识别弱特征数据。但是,把学习的主体从人换成机器,通过对弱特征数据的海量挖掘和处理,人工智能就可以通过大数据更加清晰地勾勒出信息的真实面貌。 为了观察这些弱特征,智融集团的大数据触手伸到了星座、电话拨打行为、手机电量等方方面面。“通过计算,我们发现,星座没有什么关联度,这一弱特征可以舍弃;而电池电量则是一个有效的弱特征。我们发现电池电量经常保持在比较低的状态下的人,其逾期率往往更高。”焦可说。 现在,以人工智能驱动业务发展,智融集团已经形成了正向的马太效应循环:海量的样本数量,可以让I.C.E.风控引擎精度更高,从而能够保持在高通过率的同时拥有更低的逾期率。这意味着获客成本更低、用户体验更好,并由此带来更多的用户,这是一个健康的商业模式。此后,企业可以进一步加大投入、做大规模,而更大的规模将带来更多的样本,由此进入下一个循环。 核心能力:人工智能风控技术 强大的I.C.E.风控引擎的背后,是“柯南特征工程”、“D-AI机器学习模型”以及“Anubis大数据计算架构”。 (责任编辑:本港台直播) |