机器学习——泰坦尼克号幸存者预测
1、先展示本次实验所使用的硬件信息,及所使用的第三方库信息。
2、使用魔法命令获取相应的信息,信息如图示:

4、读取泰坦尼克号数据。如图示:

7、处理缺失值。如图示:

8、提取模型所需要标签数据集。如图示:

10、数据预处理好,划分数据集,将其划分为训练集和测试集。如图示:

13、测试集的最佳评估。如图示:

15、绘制模型的学习曲线。如图示:

17、上图表示模型是欠拟合,因为测试集的成绩大于训练集的成绩。
18、下面介绍网格搜索,可以用网格搜索寻找最佳的参数组合。
19、接下来用网格搜索探索最佳参数。如图示:

22、网格搜索完毕后,可以利用best_score_属性获取最佳参数的评估成绩。如图示:

24、查看训练集的评估成绩,对比之前的评估成绩,模型的评估成绩提高了。具体如图示:

25、注意网格搜索得出的结果,并不一定都是最优的。
26、接下来绘制分类决策树。如图示:


28、以上就是分类决策树在在此案例中的应用。
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:63
阅读量:72
阅读量:35
阅读量:44
阅读量:64