ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

Python数据分析(6)----招聘信息数据分析

2021-07-01 21:03:02  阅读:184  来源: 互联网

标签:数据分析 info string Python 工资 招聘 ---- job https


## **本次实验内容为餐饮订单数据的分析,数据请见:[ https://pan.baidu.com/s/1tL7FE5lxs-gb6Phf8XRu_Q

](https://pan.baidu.com/s/1tL7FE5lxs-gb6Phf8XRu_Q)
,文件夹:data_analysis,下面的文件:job_info.csv 本次实验主要是对python中的数据进行基本操作。 **

代码为:

```code
#!/usr/bin/env python
# -*- coding:utf-8 -*-
import pandas as pd
import re

# 招聘数据探索与分析
# 1. 读取数据并存为一个名叫job_info的数据框。此处encoding='GBK'语句是为了读取中文
job_info = pd.read_csv('data_analysis/job_info.csv', encoding='GBK', header=None)
# 2. 将列命名为:['公司', '岗位', '工作地点', '工资', '发布日期']。
job_info.columns = ['公司', '岗位', '工作地点', '工资', '发布日期']
# 3. 哪个岗位招聘需求最多?
job_info['岗位'].value_counts().idxmax()

# 4. 取出9月3日发布的招聘信息。
job_info['发布日期'].value_counts() #频次统计
job_info[job_info['发布日期'] == '09-03']
job_info.loc[job_info['发布日期'] == '09-03', :]

# 5. 找出工作地点在深圳的数据分析师招聘信息。
index1 = job_info['工作地点'].apply(lambda x: '深圳' in x) #工作地点包含 '深圳'这两个字的索引
index2 = job_info['岗位'] == '数据分析师'
job_info.loc[index1 & index2, :]

# 6. 取出每个岗位的最低工资与最高工资,单位为“元/月”,若招聘信息中无工资数据则无需处理。(如2-2.5万/月,则最低工资为20000,最高工资为25000。)
job_info['工资'].str[-3].value_counts() #只处理一下按年和按月给工资的
#string = '2-3.5万/月'
def get_number(string =None):
try:
if string[-3] == '万':
x = [float(i)*10000 for i in re.findall('\d+\.{0,1}\d*', string)]
elif string[-3] == '千':
x = [float(i)*1000 for i in re.findall('\d+\.{0,1}\d*', string)]
if string[-1] == '年':
x = [i/12 for i in x]
return x
except:
return None
job_info['最低月薪']=job_info['工资'].apply(get_number).str[0]
job_info['最高月薪']=job_info['工资'].apply(get_number).str[1] #apply只能加函数名,不能加参数


```

文件‘job_info.csv’中的数据截图为:
![在这里插入图片描述](https://www.icode9.com/i/ll/?i=20200204203536228.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80Mzk4MTYyMQ==,size_16,color_FFFFFF,t_70)

运行结果如图:
![在这里插入图片描述](https://www.icode9.com/i/ll/?i=20200204203626711.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80Mzk4MTYyMQ==,size_16,color_FFFFFF,t_70)

## 注意,本例中重点运用了python中的正则表达式模块re来辅助处理‘工资’这一列数据,要留意其中对不同单位的薪资的处理方式。


![在这里插入图片描述](https://www.icode9.com/i/ll/?i=20210608151750993.gif)

标签:数据分析,info,string,Python,工资,招聘,----,job,https
来源: https://www.cnblogs.com/gc2770/p/14960708.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有