ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

Python 数据处理常用语法

2022-07-16 23:06:04  阅读:240  来源: 互联网

标签:loc 年份 Python 语法 mjfd 数据处理 apply data lambda


  • 删除某列包含特定字符的行
data = data.drop(data[data['房号'].str.contains('车位','车库')].index)
  • 处理日期数据
data['合同签订日期'] = pd.to_datetime(data['合同签订日期'])
  • 获取年份
data.loc[:,'签约年份'] = data.loc[:,'签约日期'].apply(lambda x: x.year).astype(int)
  • 将数据分段
默认right为真,即左开右闭;为假,则左闭右开
data.loc[:,'分类'] = pd.cut(data['未开工时间'],bins=[0,1,3,12],labels=['1年未开工','1-3年未开工','3年以上未开工'])
  • 截取特定位置的字符
不清楚原理,但是当使用data.loc[:,'合同签订年份']时,会报错,采用下面的语法则不会。
data['合同签订年份'] = data['合同编号'].apply(lambda x: x[7:11]).astype(int)
  • 移除字符串前后特定字符
data.loc[:,'证件号'] = data.loc[:, '证件号'].apply(lambda x: x.strip())
  • 删除为空的行
data = data.dropna(subset=['合同总价'])
  • 根据某列数据修改其他某列数据
data['居住地省份'] = data.apply(lambda row: '本市' if (row['居住地省份'] == '广东') and (row['居住地城市'] in ['湛江','廉江','遂溪','吴川','赤坎','坡头','霞山','麻章','雷州','徐闻','经济']) else row['居住地省份'], axis=1)
  • 将数据分组和重新整理
mjfd = data.groupby(['所属区县'],data['签约年份'])['面积分段'].count()
# 数据格式需要强制转化,series 转 dataframe
mjfd = mjfd.loc[:,:].to_frame()
mjfd = pd.pivot_table(mjfd,index=['所属区县','面积分段'], columns='签约年份')
  • 匹配保留数字匹配项
data['购房者出生年份'] = data['购房者出生年份'].apply(lambda x: re.sub(r'[^0-9]', '', x))
  • 筛选出特定长度字符数据
data = data[data['购房者出生年份'].str.len()==4]

 

标签:loc,年份,Python,语法,mjfd,数据处理,apply,data,lambda
来源: https://www.cnblogs.com/yxwwj/p/16485515.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有