最初的原始数据获取方式有两种,一是直接从对外开放数据的平台获取;而对于封闭数据的平台,姜燕北将数据获取来源分为生活服务、旅游、餐饮等不同领域,寻找每个领域的“第二名”进行合作,直播,当泰迪熊为它们带来精准的用户时,各领域的龙头企业便会主动寻求合作。 经过几个月的积累,泰迪熊成功获取各个垂直领域企业的数据资源。 然而,通过合作渠道获取来的数据,离姜燕北要求的“精准”还有一段距离,这些数据往往较为粗放。对此,一方面,姜燕北通过记载每个通讯录号码与用户之间,进行过多少次的呼出、呼入,以及每一次沟通的时长及沟通频次等行为,细化通讯录数据;另一方面,增加用户数据量,数据量越大,数据质量越高,对用户行为刻画越精准。 ▲ 行程日历 通过这种方式,泰迪熊每天获得10亿次用户寻求服务方的请求,解析短信6亿多条。 泰迪熊团队目前有100多人,其中60%都为技术人员。今后,泰迪熊的业务还会向手机厂商日历、备忘录等其它系统软件拓展。 总的来说 泰迪熊是一家用技术为手机厂商提供系统软件互联网化服务的公司,以通讯录识别为入口,用大数据和计算机深度学习的方式精准跟踪用户轨迹,并为用户提供通讯录直达商户下单等服务。技术是难点,也是壁垒。 (责任编辑:本港台直播) |