这些错误是由于过拟合(overfitting)。我们的决策树把训练数据的每个差别特征都看作是同等重要的分界条件,但其中有些特征是不相关的。过拟合是机器学习的一个基本概念,我们会在以后的文章中更详细讨论。 扼要重述 机器学习使用统计学习方法识别模式,从数据集中挖掘分界条件,从而作出预测。 决策树是机器学习作预测的方法之一,决策树使用if-then语句进行分界并在数据中找出模式。 当作分界的差别特征关系不大时,容易发生过拟合。可以用测试数据来检查模型的过拟合程度。 感谢两位原作者,到这里(再次领略)机器学习之美: 原文地址: :COO、执行总编、主编、高级编译、主笔、运营总监、客户经理、咨询总监、行政助理等 9 大岗位全面开放。 简历投递:j[email protected] HR 微信:13552313024 新智元为COO和执行总编提供最高超百万的年薪激励;为骨干员工提供最完整的培训体系、高于业界平均水平的工资和奖金。 加盟新智元,与人工智能业界领袖携手改变世界。 (责任编辑:本港台直播) |