首页 > 其他分享> 文章详细

pandas数据清洗-小记

2021-05-05 16:36:36 阅读：168 来源： 互联网

标签：删除 df 标签替换 pandas 清洗临界值缺失小记

1.查看数据缺失值数量

df=pd.read_csv(r'')

print(df.isnull().sum().sort_values())

2.条件筛选替换新值

df.loc[条件1,'替换列']=替换值

df[替换列]=df[替换列].replace(旧值，新值)

3.删除缺失值

df.fillna(axis=0,how=any,thresh=None,inplace=True)

axis为0指删除缺失值所在的行，1为缺失值所在的列

how:any,当前所在行或列只要有缺失值即删除；all,所在行或列全部值都为缺失值即删除

thresh:即保留多少个缺失值

inplace:True替换原数据,False不替换原数据

4.删除重复值

df.drop_duplicate()

5.切割数据

cutpoint=[临界值1，临界值2，临界值3，临界值4，.......]

grouplabel=[标签1，标签2，标签3，标签4，......]

df[新列名]=df.cut(df[切割列]，cutpoint,lables=grouplabel)

标签：删除,df,标签,替换,pandas,清洗,临界值,缺失,小记
来源： https://www.cnblogs.com/alian96/p/14731980.html

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9

pandas数据清洗-小记