标签:group color 笔记 green yellow 数据处理 price1 pandas red
导入模块
import pandas as pd
1.groupby迭代操作
frame = pd.DataFrame({'color':['yellow','red','green','red','green'],
'object':['pen','pencil','pencil','ashtray','pen'],
'price1':[5.56,4.2,1.3,0.56,2.75],
'price2':[4.75,4.12,1.6,0.75,3.15]})
for name,group in frame.groupby('color'):
print(name)
print(group)
'''
green
color object price1 price2
2 green pencil 1.30 1.60
4 green pen 2.75 3.15
red
color object price1 price2
1 red pencil 4.20 4.12
3 red ashtray 0.56 0.75
yellow
color object price1 price2
0 yellow pen 5.56 4.75
'''
2.分组函数
frame = pd.DataFrame({'color':['yellow','red','green','red','green'],
'object':['pen','pencil','pencil','ashtray','pen'],
'price1':[5.56,4.2,1.3,0.56,2.75],
'price2':[4.75,4.12,1.6,0.75,3.15]})
group = frame.groupby('color')
group['price1'].quantile(0.6) #quantile()函数计算分位数
'''
color
green 2.170
red 2.744
yellow 5.560
'''
自定义聚合函数
定义好一个函数,将其作为参数传给agg()函数
def range(series):
return series.max()-series.min()
group['price1'].agg(range)
'''
color
green 1.45
red 3.64
yellow 0.00
'''
对整个DataFrame对象用agg()函数
def range(series):
return series.max()-series.min()
group.agg(range)
同时使用多个聚合函数
group['price1'].agg([range,'mean','std'])
参考:
法比奥·内利. Python数据分析实战:第2版.北京:人民邮电出版社, 2019.11.
标签:group,color,笔记,green,yellow,数据处理,price1,pandas,red 来源: https://blog.csdn.net/weixin_46753186/article/details/121977851
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。