Python缺失值处理
1、导入需要的库。import pandas as pdimport numpy as npfrom sklearn.preprocessing import Imputer

3、查看缺失值。data.isnull()#查看所有缺失值data.isnull().any()#获取含有缺失值的列data.isnull().all()#获取全部为NA的列

4、删除缺失值。这种处理方式丢失的信息比较多。data2=data.dropna()print(data2)可以看到,删除后,仅剩两行数据。

6、利用pandas替换缺失值。data.fillna(0) #缺失值用0替换(考试中缺考记0分)data.fillna(method='pad')#用前面的值替换data.fillna(method='backfill')#用后面的值替换可以看到,当第一行有缺失值时,利用向前替换是会失败的。


声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:40
阅读量:77
阅读量:45
阅读量:73
阅读量:90