ICode9

精准搜索请尝试: 精确搜索
  • pandas之使用自定义函数2021-12-05 12:31:21

    如果想要应用自定义的函数,或者把其他库中的函数应用到 Pandas 对象中,有以下三种方法: 1) 操作整个 DataFrame 的函数:pipe() 2) 操作行或者列的函数:apply() 3) 操作单一元素的函数:applymap() 如何从上述函数中选择适合的函数,这取决于函数的操作对象。下面介绍了三种方法的使用

  • df_clean.apply(pd.to_numeric, errors='ignore')2021-12-05 09:32:32

    在复习之前学习的pandas代码时发现这句话 df_clean.apply(pd.to_numeric, errors='ignore') 感到十分疑惑,apply()是什么函数,pd.to_numeric又是啥,errors=""有啥作用。 接下来一一解答: 一、map(), apply()和applymap()   1.map():     map() 是一个Series的函数,DataFrame结构中

  • Spire.Pdf打印PDF文件2021-12-04 13:35:02

    1      /// <summary> 2 /// Spire.Pdf打印PDF文件 3 /// </summary> 4 /// <param name="fileName">包含文件路径的文件名称</param> 5 /// <returns></returns> 6 private int PrintPDF(stri

  • 时间序列预测的7种Python工具包,总有一款适合你2021-12-03 22:34:23

    欢迎关注我,IT界搬运喵专注Python!   时间序列问题是数据科学中最难解决的问题之一。传统的处理方法如 ARIMA、SARIMA 等,虽然是很好,但在处理具有非线性特性或非平稳时间序列问题时很难取得满意的预测效果。 为了获得更好的预测效果,并且可以简单高效的完成任务,本文中我将分享给大

  • itextsharp给pd添加logo、图片2021-12-03 11:35:15

    /// <summary> /// 添加图片、logo等 /// 引用组件itextsharp /// </summary> /// <param name="inputfilepath"></param> /// <param name="outputfiledir"></param>

  • Pandas图形绘制2021-11-28 23:58:53

    Pandas图形绘制 Pandas的DataFrame和Series在Matplotlib基础上封装了一个简易的绘图函数,使得数据处理过程中方便可视化查看结果。 折线图 import pandas as pd import numpy as np import matplotlib.pyplot as plt data=np.random.randn(5,2)*10 df=pd.DataFrame(np.abs(dat

  • 【python数据处理】pandas快速入门集合2021-11-28 16:04:06

    目录 Pandas常用数据类型 Series的使用 为Series指定索引值 通过字典创建Series 更改dtype 切片和索引 DataFrame的使用 DataFrame基础属性 排序 选择  缺失数据的处理 处理方式 import pandas as pd Pandas常用数据类型 1.Series一维,带标签数组(即索引,第一列为索引,第二列为

  • Pandas 常见用法个人随笔2021-11-28 11:34:40

    以前在学校里,跑深度学习实验,数据都是规则的、同质化数值型数据,很少字符型,只需熟练掌握 numpy 来处理数组、矩阵即可。 现在来工业级做推荐算法了,收集的数据大量都是字符型、异构的数据,因此需要 pandas 进行处理。乘着周末来好好梳理一下 pandas 的常见用法。 主要参考书籍: 《利用

  • 香港酒店数据分析2021-11-27 23:00:09

    数据读取 import pandas as pd import matplotlib.pyplot as plt import numpy as np # 解决中文问题 plt.rcParams['font.sans-serif'] = 'SimHei' # 读取数据 df = pd.read_excel('./香港酒店数据.xlsx') print(df.head()) # 删除第一行的空值 df = df[1:] # 重置索引 df.in

  • 数据科学——使用真实数据工作2021-11-27 21:34:32

    1、从文本文件中读取 import pandas as pd color_table = pd.io.parsers.read_table("D:\\data\Colors.txt") print(color_table) 2、读取CSV定界的格式 import pandas as pd titanic = pd.io.parsers.read_csv("D:\\data\Titanic.csv") X = titanic[['age

  • pandas读取csv文件不要把第一行自动设置成表头2021-11-27 09:31:54

    pandas读取csv文件不要把第一行自动设置成表头 首先来看一下普通的打开方式 import pandas as pd df=pd.read_csv('diaoyan.csv') df.head() 很明显,上图的效果不尽如人意,所以在读取的时候需要添加一个header参数 import pandas as pd df=pd.read_csv('diaoyan.csv',header

  • 搞懂Pandas数据合并,这一片就够了2021-11-23 23:02:01

    数据合并是数据处理过程中的必经环节,pandas作为数据分析的利器,提供了四种常用的数据合并方式,让我们看看如何使用这些方法吧! 1.concat() concat() 可用于两个及多个 DataFrame 间行/列方向进行内联或外联拼接操作,默认对行(沿 y 轴)取并集。 使用方式 pd.concat( objs: Uni

  • pandas多班级合并提取教师个人课表,多表同位置填充数据2021-11-23 12:03:46

    import pandas as pd import numpy as np from pprint import pprint pd.set_option('display.max_columns', None) data = [] classList = ["2101大数据", "2101软件", "2102软件"] ddd = pd.DataFrame(np.zeros([200, 25])) ddd.replace

  • 一文过pandas入门(中篇)——才疏学浅的莫笑天2021-11-21 22:00:32

    本篇核心内容为数据清洗。 数据清洗 数据工作的步骤应该为: 数据获取数据清洗数据分析数据可视化与建模 因此,上一篇博文中,本人说过,下一篇博文会讲一下数据分析中重要的一步 我们要知道,数据清洗本着为下一步数据分析服务的目的进行,因此,数据处理要根据数据分析确定它是否需要处

  • 非理工科编程零基础文科生秒懂python学习笔记:pandas库数据表格创建和运算基础有哪些?2021-11-21 12:03:23

    #dataframe的数据类型 #每行的数据类型可以不一样 #行索引为index 等同于excel表格最左边的1、2、3、4 #列索引为column 等同于excel表格最顶端的A|B|C|D|E #每一列都是一个series对象   目录 创建一个列表并保存为对象  创建一个带有索引号的列表并保存为对象  通过直接

  • pandas之两大数据结构2021-11-20 21:58:49

    Series 其字符串表现形式为:索引在左边,值在右边 当没有为其指定数据索引时,系统会自动创建一个[0->N-1]的索引 ''' Description: pandas-series Autor: 365JHWZGo Date: 2021-11-20 21:24:42 LastEditors: 365JHWZGo LastEditTime: 2021-11-20 21:32:18 ''' import pandas as

  • 【Python数据分析-5】:Pandas常用操作-二维数据合并concat2021-11-20 20:02:00

    concat Pandas提供了把多个DataFrame合并链接成一个DataFrame的concat的方法: In [2]: import pandas as pd In [3]: import numpy as np In [4]: data = pd.DataFrame(np.random.randn(10, 4)) In [5]: data Out[5]: 0 1 2 3 0 -0.150377

  • 【Python数据分析-1】:Pandas的常用操作-Pandas的主要数据结构Series(一维数据)和DataFrame(二维数据)2021-11-20 10:03:53

    大家好,这里是为代码封神的封神榜(有点吹牛皮了,哈哈)。还是新人初来乍到,希望大家多多指教。 本系列呢,是为大家带来的是Python数据分析,希望大家能够喜欢,多多支持。 安装Pandas 从PyPi安装: pip install Pandas 复制代码 Pandas适用场景 Pandas 适用于处理与Excel表类似的二维表格数

  • pandas Excel一次写入多个表格 读多个表格 简洁代码2021-11-19 20:04:20

    import pandas as pd filePath = r'C:\\Users\Administrator\Desktop\\21aa.xlsx' dfL = [aF,bF,cF,dF,eF] sheetL = ['a','b','c','d'] vL = ['av','bv','cv','dv'] write

  • 两列互换2021-11-17 17:33:03

    代码: import pandas as pd data = pd.read_csv("./test.csv", error_bad_lines=False, encoding="utf-8")       data = data.loc[:, ["Topology","Batch Size","KPI","FP32"]]       保存数据 data.to_csv(&

  • 使用pd.cut进行分箱操作2021-11-17 12:02:32

    1.表格 2.需求 对表格中,a列下所有的数据进行分箱处理,使得每个箱子中出现的a的数值个数是一样的 3.代码如下 def test(): df = pd.DataFrame({'a':[1.0,1.29,1.59,1.9,2.2,2.5,2.7,3.4,4.0],'b':[11,12,13,14,15,16,17,18,19]}) label = ['潜在客户', '一般发展客户'

  • Pandas还是要保持手感的 - 案例整理(持续收集)2021-11-17 11:04:17

    Pandas是这么强大的东西,不能一直看,看有印象,写才有手感。保持手感。---Python逐梦者。 1,使用列表创建Series: 1 import pandas as pd 2 3 alist = [1.5, 2.5, 3, 4.5, 5.0, 6] 4 data = pd.Series(alist) 5 print(data) 2,使用name创建Series: 1 import pandas as pd 2 3 alist =

  • 动手学数据分析Task01 数据加载及探索性数据分析2021-11-15 17:33:54

    学习目标: 边做边学,完成kaggle上泰坦尼克的任务,实战数据分析全流程。 学习内容: 第一章第一节 数据载入及初步观察 1.1 载入数据         数据集下载 Titanic - Machine Learning from Disaster | Kaggle import numpy as np import pandas as pd # 相对路径载入 df =

  • Pandas数据清洗2021-11-15 01:33:33

    数据清洗 一、数据清洗和准备 数据清洗是数据分析关键的一步,直接影响之后的处理工作 数据需要修改吗?有什么需要修改的吗?数据应该怎么调整才能适用于接下来的分析和挖掘? 是一个迭代的过程,实际项目中可能需要不止一次地执行这些清洗操作 1. 处理缺失数据: pd.fillna() pd.dropna()

  • 随机效应 VS 固定效应2021-11-14 14:03:55

    1. 固定效应 Group 中的level是pre-specified,就特殊的,就这么几个。that is, having pre-specified levels, with the goal of comparing specific levels of that effect。 例如治疗组和安慰剂组的对比,对比结论就是限制在治疗组和安慰剂组。但是,此时,patient是随机效应,两种治疗在pa

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有