欢迎投稿到早读课,投稿邮箱:[email protected] 最近,频繁遇到各类公司找我交流“用户画像该怎么做”这个问题。什么是用户画像呢?就是根据某个人表现出来的网络行为,猜他是男是女,挣多挣少,孩子多大,乃至要买什么东西这些背后的特征。 用户画像,是大数据三百六十行居家旅行、装逼煽情必备的概念,它还有个类似的概念叫受众定向。个人觉得,“用户画像”这个词听起来更加关注人口属性、生活状态这些基本静态信息,这多少有点误导:我们重点关注的,往往是某用户“最近要不要旅游”、“准备买多少钱的车”这样能驱动直接效果的动态信息。从这层意思上说,用“受众定向”更加准确。 俗话说,atv,画龙画虎难画骨,知人知面不知心。为什么知人心这么难呢,道理很简单:猜对了也好,猜错了也罢,都是一头雾水,并没有可靠的正确答案(术语称为“Ground Truth”)。对此,白居易老先生早有教诲:周公恐惧流言日,王莽谦恭未篡时,向使当初身便死,一生真伪复谁知? 用户画像,跟这个也有点类似。比方说,你把某人标成“足球爱好者”,对不对他自己都不一定拿得准。就拿中国足球事业的革命家、教育家高俅同志来说,他到底算“足球爱好者”么?恐怕答案是见仁见智的。因此,先要给大家解放下思想:除了性别、年龄这些有明确答案的标签,其他大多数兴趣标签,探讨其“准确程度”是没有意义的。
从技术层面看,用户画像的过程比较乏味,感兴趣的朋友可以参考《计算广告》一书。我们今天来讨论一个看起来最简单、却最难以把握精髓的环节:如何设计用户画像的标签体系。 什么是标签体系呢?简单说就是你把用户分到多少个类里面去。当然,每个用户是可以分到多个类上的。这些类都是啥,彼此之间有何联系,就构成了标签体系。标签体系的设计有两个常见要求,一是便于检索,二是效果显著。在不同的场景下,对这两点的要求重点是不同的。笔者见过很多做用户画像的产品经理,往往醉心于设计一个伟大、 光荣、正确的标签体系,这往往是形式主义的调调儿。 一般来说,设计一个标签体系有三种思路: 一、结构化标签体系。 简单地说,就是标签组织成比较规整的树或森林,有明确的层级划分和父子关系。结构化标签体系看起来整洁,又比较好解释,在面向品牌广告主开喷时比较好用。性别、年龄这类人口属性标签,是最典型的结构化体系。下图就是Yahoo!受众定向广告平台采用的结构化标签体系。
不过,实践当中即使是面向品牌广告主,售卖非人口属性的受众也存在很大困难,原因又回到文章开头说的问题:这些标签从原理上就是无法监测的。 二、半结构化标签体系。 在用于效果广告时,标签设计的灵活性大大提高了。标签体系是不是规整,就不那么重要了,只要有效果就行。在这种思路下,用户标签往往是在行业上呈现出一定的并列体系,而各行业内的标签设计则以“逮住老鼠就是好猫”为最高指导原则,切不可拘泥于形式。下图是Bluekai聚合多家数据形成的半结构化标签体系。
当然,标签体系太过混乱的话,投放运营起来就比较困难。因此,实践中往往还需要对一定程度的结构化做妥协,除非整个投放逻辑是机器决策的(比如个性化重定向)。 三、非结构化标签体系。 非结构化,就是各个标签就事论事,各自反应各自的用户兴趣,彼此之间并无层级关系,也很难组织成规整的树状结构。非结构化标签的典型例子,是搜索广告里用的关键词。还有Facebook用的用户兴趣词,意思也一样。 半结构化标签操作上已经很困难了,非结构化的关键词为什么在市场上能够盛行呢?这主要是因为搜索广告的市场地位太重要了,围绕它的关键词选择和优化,已经形成了一套成熟的方法论。 面向品牌的结构化标签体系,设计的好坏似乎并不太重要;而彻底非结构化的标签,也没有太多设计的需求。产品狗们碰到的难点,往往是如果设计合理的半结构化标签体系以驱动广告的实效。这里面最关键的诀窍,是深入研究某个具体行业的用户决策过程。 (责任编辑:本港台直播) |