特别是,如果我们有的观察值比较少且值很小的话,那么我们的模型会快速过拟合数据。因为我们只有几个点,如果增加模型的复杂性,如多项式的阶,它会比较容易拟合到我们的观察数据上去。 另一方面,如果我们有大量观察数据,即便用非常复杂的模型,也很难过度拟合,因为我们输入的是高密度观察数据。 35 假设您已在数据集上拟合了一个复杂的回归模型。现在,您正在使用Ridge回归与调整参数lambda以降低其复杂性。选择下面的描述,哪个表达了偏差和方差与λ的关系。 A. 在λ非常大的情况下,偏差低,方差低。 B. 在λ非常大的情况下,偏差低,方差高。 C. 在λ非常大的情况下,偏差高,方差低。 D. 在λ非常大的情况下,偏差高,方差高。 答案:C 如果λ很大,则意味着模型不是很复杂,这种情况下,会产生偏差高且方差低的结果。 36 假设您已在数据集上拟合了一个复杂的回归模型。现在,您正在使用Ridge回归,并调整参数λ以减少其复杂性。选择下面的描述,哪个表达了偏差和方差与λ的关系。 A. 在λ非常小的情况下,偏差低,方差低。 B. 在λ非常小的情况下,偏差低,方差高。 C. 在λ非常小的情况下,偏差高,方差低。 D. 在λ非常小的情况下,偏差低,方差低。 答案: B 如果λ很小,则意味着模型比较复杂,这种情况下,会产生偏差低且方差高的结果,模型会对数据过拟合。 37 关于ridge回归,下面哪个(些)说法是正确的? 1. 如果λ为0,模型等同于现行回归模型工作。 2.如果λ为0,模型不会像线性回归模型一样工作。 3. 如果λ趋向于无穷,我们会得到极小的系数,趋向于0。 4. 如果λ趋向于无穷,我们会得到极大的系数,趋向于无穷大。 A. 1和3 B. 1和4 C. 2和3 D. 2和4 答案:A 具体来说,我们可以看到,当lambda为0时,我们得到我们的最小二乘解。当λ达到无穷大时,我们得到非常小的系数,趋向于0。 38 下面的三张残差图,哪一张比另外两张表现更差一些? Note: 注意: 1. 所有的残差都已经标准化。 2. 图示均为预测值vs残差。 A. 1 B. 2 C. 3 D. 1 、2 答案:C 预测值和残差之间不应有任何联系。如果它们之间存在关系,则意味着模型没有完全捕获数据中的信息。 39 对于下面的方法,哪些系数是没有闭式解(closed form solution)的? A. Ridget回归 B. Lasso C. Ridge回归和Lasso都有 D. Ridge回归和Lasso都没有 答案:B (责任编辑:本港台直播) |