用户画像(persona)的概念最早由交互设计之父Alan Cooper提出:“Personas are a concrete representation of target users.” 是指真实用户的虚拟代表,是建立在一系列属性数据之上的目标用户模型。随着互联网的发展,现在我们说的用户画像又包含了新的内涵——通常用户画像是根据用户人口学特征、网络浏览内容、网络社交活动和消费行为等信息而抽象出的一个标签化的用户模型。构建用户画像的核心工作,主要是利用存储在服务器上的海量日志和数据库里的大量数据进行分析和挖掘,给用户贴“标签”,而“标签”是能表示用户某一维度特征的标识。具体的标签形式可以参考下图某网站给其中一个用户打的标签。
用户画像的作用 提取用户画像,需要处理海量的日志,花费大量时间和人力。尽管是如此高成本的事情,大部分公司还是希望能给自己的用户做一份足够精准的用户画像。 那么用户画像有什么作用,能帮助我们达到哪些目标呢? 大体上可以总结为以下几个方面: 1. 精准营销:精准直邮、短信、App消息推送、个性化广告等。 2. 用户研究:指导产品优化,甚至做到产品功能的私人定制等。 3. 个性服务:个性化推荐、个性化搜索等。 4. 业务决策:排名统计、地域分析、行业趋势、竞品分析等。 用户画像的内容 用户画像包含的内容并不完全固定,根据行业和产品的不同所关注的特征也有不同。对于大部分互联网公司,用户画像都会包含人口属性和行为特征。人口属性主要指用户的年龄、性别、所在的省份和城市、教育程度、婚姻情况、生育情况、工作所在的行业和职业等。行为特征主要包含活跃度、忠诚度等指标。 除了以上较通用的特征,不同类型的网站提取的用户画像各有侧重点。 以内容为主的媒体或阅读类网站,还有搜索引擎或通用导航类网站,往往会提取用户对浏览内容的兴趣特征,比如体育类、娱乐类、美食类、理财类、旅游类、房产类、汽车类等等。 社交网站的用户画像,也会提取用户的社交网络,从中可以发现关系紧密的用户群和在社群中起到意见领袖作用的明星节点。 电商购物网站的用户画像,一般会提取用户的网购兴趣和消费能力等指标。网购兴趣主要指用户在网购时的类目偏好,比如服饰类、箱包类、居家类、母婴类、洗护类、饮食类等。 消费能力指用户的购买力,如果做得足够细致,可以把用户的实际消费水平和在每个类目的心理消费水平区分开,分别建立特征纬度。 另外还可以加上用户的环境属性,比如当前时间、访问地点LBS特征、当地天气、节假日情况等。 当然,对于特定的网站或App,肯定又有特殊关注的用户纬度,就需要把这些维度做到更加细化,从而能给用户提供更精准的个性化服务和内容。
用户画像的生产 用户特征的提取即用户画像的生产过程,大致可以分为以下几步: 1. 用户建模,指确定提取的用户特征维度,和需要使用到的数据源。 2. 数据收集,通过数据收集工具,如Flume或自己写的脚本程序,把需要使用的数据统一存放到Hadoop集群。 3. 数据清理,数据清理的过程通常位于Hadoop集群,也有可能与数据收集同时进行,这一步的主要工作,是把收集到各种来源、杂乱无章的数据进行字段提取,得到关注的目标特征。 4. 模型训练,有些特征可能无法直接从数据清理得到,比如用户感兴趣的内容或用户的消费水平,那么可以通过收集到的已知特征进行学习和预测。 5. 属性预测,利用训练得到的模型和用户的已知特征,预测用户的未知特征。 6. 数据合并,把用户通过各种数据源提取的特征进行合并,并给出一定的可信度。 7. 数据分发,对于合并后的结果数据,分发到精准营销、个性化推荐、CRM等各个平台,提供数据支持。
下面以用户性别为例,具体介绍特征提取的过程: 1.提取用户自己填写的资料,atv,比如注册时或者活动中填写的性别资料,这些数据准确率一般很高。 2. 提取用户的称谓,如文本中有提到的对方称呼,例如:xxx先生/女士,这个数据也比较准。 (责任编辑:本港台直播) |