36. 假设你正在做一个项目,它是一个二元分类问题。你在数据集上训练一个模型,并在验证数据集上得到混淆矩阵。基于上述混淆矩阵,下面哪个选项会给你正确的预测。 精确度是~0.91 错误分类率是~0.91 假正率(False correct classification)是~0.95 真正率(True positive rate)是~0.95 A. 1 和 3 B. 2 和 4 C. 1 和 4 D. 2 和 3 答案(C):精确度(正确分类)是 (50+100)/165,约等于 0.91。真正率是你正确预测正分类的次数,因此真正率将是 100/105 = 0.95,也被称作敏感度或召回。 37. 对于下面的超参数来说,更高的值对于决策树算法更好吗? 用于拆分的样本量 树深 树叶样本 A. 1 和 2 B. 2 和 3 C. 1 和 3 D. 1、2 和 3 E. 无法分辨 答案(E):对于选项 A、B、C 来说,如果你增加参数的值,性能并不一定会提升。例如,如果我们有一个非常高的树深值,结果树可能会过拟合数据,并且也不会泛化。另一方面,如果我们有一个非常低的值,结果树也许与数据欠拟合。因此我们不能确定更高的值对于决策树算法就更好。 38-39 题背景 :想象一下,你有一个 28x28 的图片,并使用输入深度为 3 和输出深度为 8 在上面运行一个 3x3 的卷积神经网络。注意,步幅是 1,你正在使用相同的填充(padding)。 38. 当使用给定的参数时,输出特征图的尺寸是多少? A. 28 宽、28 高、8 深 B. 13 宽、13 高、8 深 C. 28 宽、13 高、8 深 D. 13 宽、28 高、8 深 答案(A):计算输出尺寸的公式是:输出尺寸=(N – F)/S + 1。其中,N 是输入尺寸,F 是过滤器尺寸,S 是步幅。阅读这篇文章(链接:https://www.analyticsvidhya.com/blog/2016/04/deep-learning-computer-vision-introduction-convolution-neural-networks/)获得更多了解。 39. 当使用以下参数时,输出特征图的尺寸是多少? A. 28 宽、28 高、8 深 B. 13 宽、13 高、8 深 C. 28 宽、13 高、8 深 D. 13 宽、28 高、8 深 答案 (B):同上 40. 假设,我们正在 SVM 算法中为 C(惩罚参数)的不同值进行视觉化绘图。由于某些原因,我们忘记了使用视觉化标注 C 值。这个时候,下面的哪个选项在 rbf 内核的情况下最好地解释了下图(1、2、3 从左到右,图 1 的 C 值 是 C 1,图 2 的 C 值 是 C 2,图 3 的 C 值 是 C 3)中的 C 值。 A. C1 = C2 = C3 B. C1 > C2 > C3 C. C1 < C2 < C3 D. 没有一个 答案 (C):错误项的惩罚参数 C。它也控制平滑决策边界和训练点正确分类之间的权衡。对于 C 的大值,优化会选择一个较小边距的超平面。更多内容:https://www.analyticsvidhya.com/blog/2015/10/understaing-support-vector-machine-example-code/ 原文地址:https://www.analyticsvidhya.com/blog/2017/04/40-questions-test-data-scientist-machine-learning-solution-skillpower-machine-learning-datafest-2017/
本文为机器之心编译,转载请联系本公众号获得授权。 ?------------------------------------------------ 加入机器之心(全职记者/实习生):[email protected] 投稿或寻求报道:[email protected] 广告&商务合作:[email protected] (责任编辑:本港台直播) |