实际上我们刚才讲到的冷启动问题,就是你怎么把用户在一个已知库上的行为,就是绿色的矩阵,扩张到一个不断有新剧出来,蓝色的更大的矩阵?这个矩阵的行和列,就是剧跟剧之间的关系,所以当你的剧集从已知两万剧的小库,变成一个 10 万剧的大库时,你就是要从绿色的矩阵到蓝色的矩阵当中。
我们用的方法就是基于源数据方法,你就可以产生一跳,比如这是一个 LIVE 的剧,这是一个 SWA 的剧,你想他们这些相关性,这一跳用得是原数据的方法得到的,那这个数就不是零了。 然后知道这个数之后,你想知道同样这个剧和另外一个 SWA 里面剧的关系的时候,你可以借助这两个剧在这个矩阵里的关系,就是给他乘一下,然后再乘一下,你就可以到它下一个数。这是一个比较简单的描述,当然具体的做法比这稍微复杂一些。 以上就是本次公开课的所有关键内容。据说接下来,Hulu 将会和 IEEE 联合举办 Hulu 算法公开赛,公开赛于 3 月 11 日开始报名,4 月 3 日会向参赛者发布数据集,5 月 17 日为提交结果的截止日期。感兴趣的同学,可以点击报名网站查看详情: 本次课程完整笔记与 PPT,请点击「极客公开课·知乎 Live」第一期或扫描下方二维码查看获取: 本文由极客公园原创 转载联系 [email protected]
(责任编辑:本港台直播) |