notes

2022-04-02 18:35:46 阅读：203 来源： 互联网

标签：index 函数 df notes pd print pandas

"""

#Lambda表达式(lambda expression) 是一个匿名函数，Lambda表达式基于数学
#λ演算得名，直接对应于其中的lambda抽象（lambda abstraction），是一个匿名函数，
#即没有函数名的函数。Lambda表达式可以表示闭包。

#函数返回值表达式语句
#利用Lambda函数 [然后这个是逆序]
li=[{"age":20,"name":"def"},{"age":25,"name":"abc"},{"age":10,"name":"ghi"}]
li=sorted(li, key=lambda x:x["age"])
print(li)

#如果不用Lambda的函数就会书写偏繁冗
def comp(x):
return x["age"]
li=[{"age":20,"name":"def"},{"age":25,"name","abc"},{"age":10,"name","ghi"}]
li=sorted(li, key=comp)
print(li)

#IQR系数，Inter-Quartile Range, 内距又称为四分位差，是两个四分位数之差，
即内距IQR=高四分位数-低四分位数

#os库
#我最熟知的os的库，通常更喜欢跟path进行合作或者一起使用。经常跟文件一起使用。

#def用法
#def函数的意义就在于，它是一个定义函数，definition。然后就简单来理解，就是写代码太长了，
所以就弄了一个def语句，这样下面的语言引用的时候，就直接用def的命名就可以了，然后def以下进行计算。
这样就比较方便看着没那么难受。
#y=f(x),y是x的函数，x是自变量。
#f(x)=2*x
function body
return
def f(x):
return 2*x
print(f(6))

#groupby中函数主要的作用是进行数据的分组以及分组后的组内运算。
#df[](指输出数据的结果属性名称).groupby([df["地区"],df["类型"]]).mean())
def add_aux_cols(df, key, date, value, days,)

#pandas 生成series
import numpy as np
import pandas as pd

s = pd.Series([1,3,5,np.nan,6,8])
s
s1 = pd.Series([1,2,3])
s1

import numpy as np
import pandas as pd
#有6个区间日期
dates = pd.date_range('20130101',periods=6)
dates

import numpy as np
import pandas as pd
dates = pd.date_range('20130101',periods=5)
#5个日期，3列输出数据，index就是纵轴的日期，columns指的就是横轴
df = pd.DataFrame(np.random.randn(5, 3),index=dates, columns=list('ABC'))
df

#生成字典
#apply函数
df=df.apply(np.cumsum)
df

#**kwargs就是记录参数的意思，传入一些特定的参数
def test_

#Python中apply函数格式为：apply(func,*args,**kwargs)
#当然，func可以是匿名函数。
#用途：当一个函数的参数存在于一个元组或者一个字典中时，用来间接的调用这个函数，
并将元组或字典中的参数按照顺序传递给参数。

df2 = pd.DataFrame({'A':1.,
'B':pd.Timestamp('20130102'),
'C':pd.Series(1,index=list(range(4)), dtype='float32'),
'D':np.array([3] * 4, dtype='int32'),
'E':pd.Categorical(["test","train","test","train"]),
'F':'foo'})
df2
#查询数据不同类型
df2.dtypes

df.head()
#只写前三列
df.tail(3)
#相当于横坐标是多少,显示索引与列名
df.index
#相当于纵坐标是多少
df.columns

#DataFrame.to_numpy()输出底层数据的Numpy对象。注意，DataFrame的列由多种数据类型组成时，
#该操作耗费系统资源比较大，这也是Pandas和Numpy的本质区别：Numpy数组只有一种数据类型，
df.to_numpy()
df2.to_numpy()

#If 函数，我对if函数的理解最多的是，因为代码容易报错，所以这个时候，代码需要一个“缓冲选项”，
就是如果if(A)选项无法执行的时候，那么(B)选项就可以作为备选。
#
#loc函数-这个指的是布尔值

#pandas tolist()函数
#第一步读取函数
import pandas as pd
df = pd.read_excel('')
print(df)
print(type(def))
#然后第二步骤使用tolist()
a = df['model'].tolist()
print(a)
print(type(a))

#group by用法,联合一些统计的要素，进行计算。
#agg也可以用来进行计算，就是集合计算（先暂时这么理解吧）
A.groupby(["班级"，"性别"].agg([np.sum,np.mean,np.std])

#然后和apply进行合并联用
#找到固定的一个特定对象，比如说特定的那一个月
A.groupby(A["生日"].apply(lambda x:x.month),as_index=False) #到这里是按月分组
A.groupby(A["生日"].apply(lambda x:x.month),as_index=False).filter(lambda x:len(x)==1)

#About Concat功能
frames = df

"""
import pandas as pd
import numpy as np

series=pd.Series(data=range(0,10))
series

print(series.index)

import pandas as pd
#ufo = pd.read_csv('uforeports.csv')

#check 前五行
ufo.head()
#head 就是看开头的意思

#然后看特定这city一列
ufo['City']

pd.read_csv(r'C:\Users\15533\Desktop\MM.csv',encoding='utf-8')

#组2 查询数据类型
import pandas as pd
data_df = pd.read_csv(r'C:\Users\15533\Desktop\MM.csv',encoding='utf-8')
#data_df查询数据类型
data_df.info()

#组1
import pandas as pd
YA = pd.read_csv(r'C:\Users\15533\Desktop\MM.csv',encoding='utf-8')
YA.head()
#选取和查询特定序列
#YA['AAA']
#YA.AAA

#两列相加
#YA.AAA + YA.BBB

#两个series加在一起
YA.AAA + ',' + YA.BBB

#斜杠可以换行这样避免可以写冗长的代码

#pandas基本介绍
#一维：series
#二维：DataFarme(重点)
#三维：Multilndex
#read_csv不能用网站(目前看来是不能用网站的)
import pandas as pd
movies = pd.read_csv("https://www.zhihu.com/question/43647074")
movies.head()

import numpy as np
#0到100的数据范围，横向为5个数字，纵向是10个数字。
data = np.random.randint(0,100,(10,5))
print (data)

#Dataframe的创建
import numpy as np
data=np.random.randint(0,100,(10,5))
#横向
columns=["语文","数学","英语","物理","化学"]
index=['同学' + str(i) for i in range(data.shape[0])]
dataframe=pd.DataFrame(data,columns=columns,index=index)
dataframe
#print(dataframe.shape)
#print(dataframe.index)
print(dataframe.columns) #title
print(dataframe.values)

stu = ["学生_" + str(i) for i in range(score_df.shape[0])]

data.index = stu

标签：index,函数,df,notes,pd,print,pandas
来源： https://www.cnblogs.com/yanniandfacenini/p/16093481.html

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9

notes