每棵树的最大深度设置为 10,每个节点的最小训练行数为 1. 创建训练集样本的大小与原始数据集相同,这也是随机森林算法的默认预期值。 我们把在每个分裂点需要考虑的特征数设置为总的特征数目的平方根,即 sqrt(60)=7.74,取整为 7。 将含有三组不同数量的树同时进行评估,以表明添加更多的树可以使该算法实现的功能更多。 最后,运行这个示例代码将会 print 出每组树的相应分值以及每种结构的平均分值。如下所示: Trees: 1 Scores: [68.29268292682927, 75.60975609756098, 70.73170731707317, 63.41463414634146, 65.85365853658537] Mean Accuracy: 68.780% Trees: 5 Scores: [68.29268292682927, 68.29268292682927, 78.04878048780488, 65.85365853658537, 68.29268292682927] Mean Accuracy: 69.756% Trees: 10 Scores: [68.29268292682927, 78.04878048780488, 75.60975609756098, 70.73170731707317, 70.73170731707317] Mean Accuracy: 72.683% 扩展 本节会列出一些与本次教程相关的扩展内容。大家或许有兴趣一探究竟。 (责任编辑:本港台直播) |