ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

scikit-learn中处理缺失值的方法SimpleImputer

2021-01-21 20:01:54  阅读:270  来源: 互联网

标签:imputer fit housing scikit 中位数 num learn SimpleImputer


使用方法
首先,创建一个imputer实例,指定你要用属性的中位数值替换该属性的缺失值:

from sklearn.impute import SimpleImputer

imputer = SimpleImputer(strategy="median")

由于中位数值只能在数值属性上计算,所以我们需要创建一个没有文本属性的数据ocean_proximity
housing_num = housing.drop("ocean_proximity", axis=1)
使用fit()方法将SimpleImputer实例适配到训练集:
imputer.fit(housing_num)
这里imputer仅仅只是计算了每个属性的中位数值,并将结果存储在其实例变量statistics_中。
imputer.statistics_
现在,使用这个“训练有素”的imputer将缺失值替换成中位数值完成训练集转换
X = imputer.transform(housing_num)
当然也可以直接使用来完成fit和transform两步操作
Y = imputer.fit_transform(housing_num)
结果是一个包含转换后特征的Numpy数组。如果你想要将它放回Pandas DataFrame,
housing_tr = pd.DataFrame(X, columns=housing_num.columns)
其中的参数columns是设置列名

标签:imputer,fit,housing,scikit,中位数,num,learn,SimpleImputer
来源: https://blog.csdn.net/weixin_46013817/article/details/112969851

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有