ICode9

精准搜索请尝试: 精确搜索
  • Pandas系列(十八)- 多重索引2019-12-29 11:54:31

    多级索引 多级索引(也称层次化索引)是pandas的重要功能,可以在Series、DataFrame对象上拥有2个以及2个以上的索引。实质上,单级索引对应Index对象,多级索引对应MultiIndex对象。 一、Series对象的多级索引 多级索引Series对象的创建 import pandas as pd import numpy as np se1=p

  • Python高级应用程序设计任务要求2019-12-21 16:51:38

    一、主题式网络爬虫设计方案(15分) 1.主题式网络爬虫名称 名称:爬取链家北京地区的房地产信息 2.主题式网络爬虫爬取的内容与数据特征分析 爬取房子的地区与价格分布,分析其关系 3.主题式网络爬虫设计方案概述(包括实现思路与技术难点)  python鼓励解耦合开发及时功能的拆分和模块的相

  • pandas 的拼接merge和concat函数小结2019-11-05 14:02:52

    pandas中数据的合并方案主要有concat,merge,join等函数。 其中concat主要是根据索引进行行或列的拼接,只能取行或列的交集或并集。 merge主要是根据共同列或者索引进行合并,可以取内连接,左连接、右连接、外连接等。 join的功能跟merge类似,因此不再赘述。 import pandas as pd from

  • 数据集的合并2019-10-03 21:02:19

    import pandas as pddf1=pd.DataFrame({'key':['a','b','c'],'data1':range(3)})df2=pd.DataFrame({'key':['a','b','d'],'data2':range(3)})pd.merge(df1,df2) #只合并交

  • 常用统计量分析2019-10-03 19:54:25

    import pandas as pd df1=pd.read_csv("./data/data1.csv",encoding='gbk',index_col='产品编码')print(df1.head())#获得数据print(len(df1))print(df1.index.size)#求均值mean 中位数 medianprint(df1['供应商进货价'].mean())print(df1['供应商进货价&

  • pandas对excel遍历读取与填充:涉及多张表的保存、NAN的类型处理、NAN的处理(str类型下)2019-10-03 16:52:44

    代码如下: import pandas as pddf1 = pd.read_excel("小学//数学.xlsx", sheet_name="repository", dtype={"涉及题目": str})df1 = df1.set_index("ID")df2 = pd.read_excel("小学//数学.xlsx", sheet_name="problems")df2 = d

  • python基础库-Pandas2019-08-22 12:52:15

    一、Series import numpy as npimport pandas as pd#下面是创建Series的三种方法#方法1:s1 = pd.Series([1,2,3,4]) #方法2:s2 = pd.Series(np.arange(10)) # 通过numpy.arange创建#方法3:s3 = pd.Series({'1':1,'2':2,'3':3}) # 通过字典创建s1.values # 查看值s1.index # 查看索

  • Pandas:DataFrame的交集并集补集(列标签是相同的)2019-08-20 19:39:01

    原文链接:https://blog.csdn.net/weixin_42080294/article/details/89183779 版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/weixin_42080294/article/details/89183779   df1

  • pandas 实现 Excel 常见操作 (1)2019-08-19 15:42:38

    Excel 是数据处理最常用的工具,pandas 是数据分析的利器。那么,Excel 一些常见的操作, pandas 如何实现呢?网上有两篇挺有意思的文章,对此做了详细介绍。我结合自己在学习博文过程中的理解,总结成文。 本篇介绍 pandas 的 DataFrame 对列 (Column) 的处理方法。示例数据请从这里

  • 透视表2019-08-15 12:53:16

    import pandas as pd # 构造数据df = pd.DataFrame({'A': np.random.randint(3, size=(5, )), 'B': ['a', 'b', 'a', 'c', 'b'], 'C': np.random.randint(4, size=(5, ))}) # 透视表df1 = df.pivot

  • “真”pandas“假”sql2019-08-13 14:02:32

    这篇博客利用了 pandas 对数据像 sql 一样去处理。 读取测试数据 import pandas as pd import numpy as np url = 'https://raw.github.com/pandas-dev/pandas/master/pandas/tests/data/tips.csv' tips = pd.read_csv(url) # 读取数据 tips.head() 测试数据的前5行如下: S

  • pandas之数据选择2019-08-09 09:04:34

    pandas中有三种索引方法:.loc,.iloc和[],注意:.ix的用法在0.20.0中已经不建议使用了 import pandas as pd import numpy as np In [5]: dates = pd.date_range("20170101",periods=6) df1 = pd.DataFrame(np.arange(24).reshape(6,4),index=dates,columns=["A","B",&quo

  • pandas-16 pd.merge()的用法2019-07-26 21:01:02

    pandas-16 pd.merge()的用法 使用过sql语言的话,一定对join,left join, right join等非常熟悉,在pandas中,merge的作用也非常类似。 如:pd.merge(df1, df2) 找到一个外键,然后将两条数据合并成一条。 直接上例子: import numpy as np import pandas as pd from pandas import Series, Dat

  • 10个Python Pandas技巧,让工作更有效率!2019-07-13 21:36:22

    Pandas是一个广泛用于结构化数据的Python包。本文将介绍一些读者可能以前不知道的很实用的技巧。 read_csv 每个人都知道这个命令。但是读取的数据很大,可以尝试添加这个参数:nrows = 5以便在实际加载整个表之前读取表的一小部分。然后你可以通过选择错误的分隔符来避免错误

  • pandas之基础操作2019-07-13 16:56:08

    一、两种核心数据结构的创建    ''' pandas基础操作'''import pandas as pdimport numpy as np# 创建Series类型的数据p1 = pd.Series([90, 86, 70], index=['leo', 'kate', 'john'])print(p1)dict = {'leo': 90, 'ka

  • pandas 的concat操作2019-07-08 10:02:57

    pd.concat(objs, axis=0, join='outer', ignore_index=False, keys=None,levels=None, names=None, verify_integrity=False, copy=True) frame = [f1, df2, df3] df = pd.concat(frame, keys=['x', 'y', 'z']) keys是把连接的df命名以便于能快手找

  • Numpy和Pandas常用函数速查表2019-07-07 17:08:56

    Numpy和Pandas常用函数速查表 Numpy 函数 功能 np.sin() 对每个元素求正弦 np.cos() np.arange(num1, num2) 创建一个从num1到num2-1的数组 array < number 返回一个bool值的数组,大于number为True,小于为False array.reshape(行,列) 改变array的形状 ar

  • python数据分析-06DataFrame继续深入2019-07-04 10:51:31

    import pandas as pdimport numpy as npfrom pandas import Series,DataFrame#重命名DataFrame的indexdf1 = DataFrame(np.arange(9).reshape(3,3),index=["BJ","SH","GZ"],columns=["A","B","C"])# print(df1)#

  • 租房数据分析,knn算法使用2019-06-30 23:01:03

    import numpy as npimport pandas as pdimport matplotlib.pyplot as pltdata = pd.read_excel('jiemo.xls') # 导入当前文件夹下的58.csv数据文件df=pd.DataFrame(data)df1=df.dropna()df1['平方']=df1['平方'].str.replace("㎡","")df1[&#

  • pandas写入多组数据到excel不同的sheet2019-06-21 18:01:42

    今天朋友问了我个需求,就是如何将多个分析后的结果,也就是多个DataFrame,写入同一个excel工作簿中呢? 之前我只写过放在一个sheet中,但是怎么放在多个sheet中呢?下面我在本地windows电脑中写的。希望对广大程序员有所帮助。   # -*- coding: utf-8 -*-# @Time : 2019/6/21 14:36# @A

  • Python pandas库 ->groupby分组操作2019-05-11 12:39:44

    首先 在SQL中 分组操作group by是对行记录的拆分 在pandas中 分组操作groupby可以选择对行或者列进行拆分 pandas分组之后可以根据每组的组名value(非列名)访问部分数据 类似于SQL中 group by之后的having 分组列名=value 最后都是用聚合方法 合并计算数据 1 import numpy as np

  • Python中近期Pandas使用总结2019-04-15 13:52:51

    近期做了很多关于数据处理的问题,发现灵活运用pandas包对于数据分析来说可以轻松好多 导包 import numpy as npimport pandas as pdfrom pandas import DataFrame,Series   #读取excel表格,这是一个dataframe数据 table = pd.read_excel(r'***.xlsx')   #转换元素的数据类型 table[

  • 【python学习】HDF数据的处理以及Pandas使用2019-03-11 22:52:19

    import pandas as pd import numpy as np import datetime import pickle df1 = pd.read_hdf('D:/000data/station_data/airemiss_station_1001A.h5') # 得到表头信息 head = df1.columns

  • 风控数据分析学习笔记(二)Python建立信用评分卡2019-02-19 10:02:50

    本篇根据(一)(https://www.jianshu.com/p/2759e090bd53)中所提到的,利用过往数据对好坏客户的划分,使用Python建立信用评分卡,对用户行为进行打分,通过分数高低来预测借款人未来的还款能力和意愿以及好坏用户的可能性。至于建立ABC卡则需要对自变量和因变量有针对性的进行调整,流程大体

  • Pandas玩转数据2019-01-27 16:02:19

    Pandas玩转数据 一、排序功能 0x1 Series的排序 s1 = Series(np.random.randn(10)) s2 = s1.sort_values(ascending=False) # 按照值降序排列 s2.sort_index() # 按照索引升序排列 0x2 Dataframe的排序 df1 = DataFrame(np.random.randn(40).reshape(8,5), columns=['A

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有