另外,应该指明,{λ(t)} 被选作常量无论如何都是必要的,我们为动态贴现因子序列 {λ(t)} 提供了一个泛化的 DFOP(缩写为 G-DFOP),对应于 (11) 式,其也被证明是一个一次通过(one-pass)算法。第 1 节的详细证明参阅补充材料。 对于分类场景,y(t) 不再是一个实值输出,而是一个离散值,出于方便我们假设 y(t) ∈ {−1, +1}。在分类时,会在原来的输出步骤上进行一点细微的调整,其效果在下一节中通过实验获得了验证。 假设特征是 d 维的,在算法处理步骤中我们只需要记住: 易言之,存储总是 O(d^2),其与训练实例的数量无关。此外,在第 t 时间戳(time stamp)时,wˆ (t) 的更新也与先前的数据项不相关,即每一个数据项一旦被扫描,即被舍弃。 4.2. 理论保证 这一节中,我们在一个非平稳回归场景中开发了一个估计的误差界(error bound)。 5. 实验 图 1: 在合成数据集上,7 种方法在 holdout 精确度方面的表现对比。左边是全部的 7 种方法;为了清晰,右边只绘制了 RLS、DWM 和 DFOP。 图 2 :在带有分布变化的 4 个数据集上使用不同的遗忘因子的累积精确度 本文为机器之心编译,转载请联系本公众号获得授权。 ✄------------------------------------------------ 加入机器之心(全职记者/实习生):[email protected] 投稿或寻求报道:[email protected] 广告&商务合作:[email protected] (责任编辑:本港台直播) |