在python中按特定年份分组数据

2019-10-25 07:56:22 阅读：851 来源： 互联网

标签：pandas-groupby pandas aggregate python

我想创建一个按区域和日期分组的数据框,以显示特定年份区域的平均年龄.所以我的对话看起来像

region, year, average age

到目前为止,我有：

#specify aggregation functions to column'age'    
ageAverage = {'age':{'average age':'mean'}} 

#groupby and apply functions    
ageDataFrame = data.groupby(['Region', data.Date.dt.year]).agg(ageAverage)

这很好用,但是如何做到这一点,以便仅对特定年份的数据进行分组？比如说2010年到2015年之间？

解决方法:

您首先需要按between进行过滤：

ageDataFrame = (data[data.Date.dt.year.between(2010, 2015)]
                  .groupby(['Region', data.Date.dt.year])
                  .agg(ageAverage))

同样在last version of pandas 0.22.0中获得：

SpecificationError: cannot perform renaming for age with a nested dictionary

正确的解决方案是在groupby之后指定列表中的列并按元组进行聚合-第一个值是新列名,第二个是聚合函数：

np.random.seed(123)

rng = pd.date_range('2009-04-03', periods=10, freq='13M')
data = pd.DataFrame({'Date': rng,
                     'Region':['reg1'] * 3 + ['reg2'] * 7,
                     'average age': np.random.randint(20, size=10)})  
print (data)
        Date Region  average age
0 2009-04-30   reg1           13
1 2010-05-31   reg1            2
2 2011-06-30   reg1            2
3 2012-07-31   reg2            6
4 2013-08-31   reg2           17
5 2014-09-30   reg2           19
6 2015-10-31   reg2           10
7 2016-11-30   reg2            1
8 2017-12-31   reg2            0
9 2019-01-31   reg2           17

ageAverage = {('age','mean')}

#groupby and apply functions    
ageDataFrame = (data[data.Date.dt.year.between(2010, 2015)]
                 .groupby(['Region', data.Date.dt.year])['average age']
                 .agg(ageAverage))
print (ageDataFrame)
             age
Region Date     
reg1   2010    2
       2011    2
reg2   2012    6
       2013   17
       2014   19
       2015   10

标签：pandas-groupby,pandas,aggregate,python
来源： https://codeday.me/bug/20191025/1927163.html

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9

在python中按特定年份分组数据