标签:Lesson7 函数 自定义 df col2 col3 col1 print Pandas
简介
如果想要应用自定义的函数,或者把其他库中的函数应用到 Pandas 对象中,有以下三种方法:
- 操作整个 DataFrame 的函数:pipe()
- 操作行或者列的函数:apply()
- 操作单一元素的函数:applymap()
下面介绍了三种方法的使用。
1 操作整个数据表
通过给 pipe() 函数传递一个自定义函数和适当数量的参数值,从而操作 DataFrme 中的所有元素。
下面示例,实现了数据表中的元素值依次加 3。
df = pd.DataFrame(np.arange(6).reshape(2,3),columns=['col1','col2','col3']) #相加前 print(df) #相加后 print(df.pipe(add,3))
输出结果:
col1 col2 col3 0 0 1 2 1 3 4 5 col1 col2 col3 0 3 4 5 1 6 7 8
2 操作行或列
如果要操作 DataFrame 的某一行或者某一列,可以使用 apply() 方法,该方法与描述性统计方法类似,都有可选参数 axis,并且默认按列操作。示例如下:
df2 =pd.DataFrame(data=np.arange(6,12).reshape((-1,3)),columns=['col1','col2','col3'],index=[2,3]) df = df.append(df2) df
输出结果:
col1 col2 col3 0 0 1 2 1 3 4 5 2 6 7 8 3 9 10 11
继续:
df.apply(np.mean)
输出结果:
col1 4.5 col2 5.5 col3 6.5 dtype: float64
示例:
df.apply(np.mean,axis =1)
输出结果:
0 1.0 1 4.0 2 7.0 3 10.0 dtype: float64
求每一列中,最大值与最小值之差。示例如下:
print(df.apply(lambda x: x.max() - x.min()))
输出结果:
col1 9 col2 9 col3 9 dtype: int64
3 操作单一元素
DataFrame 数据表结构的 applymap() 和 Series 系列结构的 map() 类似,它们都可以接受一个 Python 函数,并返回相应的值。
示例如下:
df = pd.DataFrame(np.arange(6).reshape((-1,3)),columns=['col1','col2','col3']) print(df) #自定义函数lambda函数 print(df['col1'].map(lambda x:x*2))
输出结果:
col1 col2 col3 0 0 1 2 1 3 4 5 0 0 1 6 Name: col1, dtype: int64
下面示例使用了 applymap() 函数,如下所示:
#自定义函数 df = pd.DataFrame(np.arange(6).reshape((-1,3)),columns=['col1','col2','col3']) print(df.applymap(lambda x:x*2)) print(df.apply(np.mean))
输出结果:
col1 col2 col3 0 0 2 4 1 6 8 10 col1 1.5 col2 2.5 col3 3.5 dtype: float64
标签:Lesson7,函数,自定义,df,col2,col3,col1,print,Pandas 来源: https://www.cnblogs.com/BlairGrowing/p/15866516.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。