Lookalike算法本身其实并不复杂,但是目前很多DMP平台提供的Lookalike算法对于广告主来说更像是一个黑盒子,一方数据输入进算法后,通常广告主并不知道算法内部发生了什么,也并没有留有可供业务人员参与的接口,只需等待算法按你的要求输出指定类型的数据。通常来说,广告主只有在通过线上广告真正触达到相关受众群体之后,才能了解机器学习的效果是否符合预期。 对于这种Lookalike算法的客户体验肯定是不好的,判断某家DMP是否能在广告营销中为广告主带来价值,通常比拼的是Lookalike算法工程化方面的实力,这些实力体现在以下方面: (1)算法的学习维度是否可以调节 虽然理论来说,Lookalike算法维度增多对提高学习精度是有利的,但是现实生活中人群表现出的一些特征有时候是出于主动选择的结果,有时候是由于客观条件限制导致被动选择的结果(例如某款产品只在部分区域发售),因此对于算法的学习维度需要具备预先手动调节的能力,排除掉一些不必要的学习维度。 (2)是否可以根据相似度选取最终人群的规模 对于学习输出的人群,与种子人群的相似度越高就说明越符合要求,但同时规模也越小。一次广告营销所需要触达的人群会根据本次营销的目标不同而有很大的变化,例如对于品效兼顾的营销,人群触达的规模也是一个非常重要的指标,而对于纯粹效果类广告,则是希望能够触达尽可能精准的目标人群。通过相似度灵活的选取最终人群的规模,对于业务人员来说,是一个非常有用的功能。 (3)学习结果是否可设定过滤条件 具体的营销活动会有很多限制,例如某款游戏在IOS和Android上的营销预算不同,因此希望IOS目标人群和Android目标人群规模符合一定的比例;某些垂直媒体主要做三四线城市的下沉,希望更多选取三四线城市的人群等,可以通过灵活的条件筛选会使得算法可以支持更多更丰富的应用场景。 (4)一些工程化指标 其他一些工程化指标对于算法的易用性、可用性非常重要,例如现实情况中的数据质量往往不是特别好,用来学习的样本数据维度很多时候不完整,甚至有些样本的某些维度是缺失的,这就要求算法能很好的适应这种不完整的数据,同时保证精度不迅速恶化; 在现实业务应用场景中,营销业务人员通常不具备很深度的数据挖掘背景,因此挖掘算法在应用环节不应该设计的非常复杂,如需要业务人员调节某些参数来优化模型的精度等; 算法的效率和收敛速度同样非常重要,对于动辄上亿的样本,几百万的特征维度来说,业务场景要求在分钟量级返回计算结果,因此算法的性能和各厂家的计算能力是非常大的门槛。 第三、Lookalike算法的应用Tips (1)结合聚类算法一起使用 有时候客户提供过来的种子人群成分是非常复杂的,往往是参杂了大量子类人群的总和,如果直接拿这些种子人群进行lookalike,则相当于把人群的特征进行了弱化,最终找出来的相似人群特征会变得不明显。例如某奢侈品牌,他们的一方种子人群中包含2类,一类是真正有钱的人群,平时开豪车住别墅的,另外一类是普通的城市小白领,他们往往攒好几个月的工资进行一次消费。这2种人群必须先通过聚类算法区分出来,然后再输入Lookalike算法去扩大。 (2)在什么媒体上用 Lookalike算法选出的人群最终是在媒体的流量人群中实现触达,因此媒体自身流量对最终Lookalike算法落地的效果影响非常大,例如我们做过的某次营销案例,选取某DSP做为精准营销的落地媒体,在整个4周的营销过程中,最终选取的精准人群只有2%曝光成功。(一方面由于该DSP媒体流量均为长尾流量,而我们选取的目标人群为金融类目标人群,该DSP对目标人群覆盖率低,另外由于低价策略,竞价成功率低也导致了最终触达的精准人群规模比较小。)最终我们分析了这2%成功曝光的人群,发现他们也是Lookalike算法相似度相对较低的,也就是说最相似的那部分目标人群在该媒体上并没有出现和竞得。 因此为了保证Lookalike算法落地的效果,开奖,选取与广告主自身产品相对匹配的目标媒体以及合适的出价都非常重要。 (3)根据效果数据优化Lookalike算法 (责任编辑:本港台直播) |