ICode9

精准搜索请尝试: 精确搜索
  • pandas实现筛选功能方式2022-03-20 09:33:06

    1 筛选出数据的指定几行数据 data=df.loc[2:5] #这里的[2:5]表示第3行到第5行内容,[]第一个起始是0,表示数据的第一行 2 筛选出数据某列为某值的所有数据记录   data = df[(df['列名1']== ‘列值1’)] # 多条件匹配时 data_many=df[(df['列名1']== ‘列值1’)&(df['列名2']=

  • 8个Python数据清洗代码,学起来~2022-03-19 20:58:07

    不管你承不承认, 数据清洗 着实不是一件简单的任务,大多数情况下这项工作是十分耗时而乏味的,但它又是十分重要的。 如果你经历过数据清洗的过程,你就会明白我的意思。而这正是撰写这篇文章的目的——让读者更轻松地进行数据清洗工作。 事实上,我在不久前意识到,在进行数据清洗时,有

  • Linux进阶指令 2022-3-192022-03-19 15:03:52

    Linux进阶指令 1、df指令--查看磁盘空间 df df -h -h 以可读性较高的形式 2、free指令--查看内存使用情况 3、head指令--查看一个文件的前n行,如果不指定n,则默认显示前10行 4、tail指令--查看一个文件的后n行,如果不指定n,则默认显示最后10行 作用1:查看文件后n行 作用2:查看一个

  • python DataFrame数据格式化(设置小数位数,百分比,Python常用面试题2022-03-19 10:02:08

    python DataFrame数据格式化 1.设置小数位数 1.1 数据框设置统一小数位数 1.2 数据框分别设置不同小数位数 1.3 通过Series设置DataFrame小数位数 1.4 applymap(自定义函数) 2. 设置百分比 3. 设置千分位分隔符 参考: python数据分析从入门到精通 明日科技编著 清华

  • 【第十届“泰迪杯”数据挖掘挑战赛】B题:电力系统负荷预测分析 ARIMA、AutoARIMA、LSTM、Prophet、多元Prophet 实现2022-03-18 17:31:32

    目录 相关链接完整代码下载链接1 读取数据预处理的文件2 查看时序3 异常值缺失值3.1 HeatMap颜色3.2 缺失值处理(多种填充方式) 4 数据平滑与采样5 平稳性检验6 数据转换7 特征工程7.1 时序提取7.2 编码循环特征7.3 时间序列分解7.4 滞后特征7.6 探索性数据分析7.7 相关性分

  • python Excel数据表格转为HTML网页数据表格2022-03-11 11:32:16

    python Excel数据表格转为HTML网页数据表格 文章目录 准备test数据Excel转html 准备test数据 首先,准备一个excel。以以下代码为例,在当前目录下生成一个Excel文件:test.xslx。 import pandas as pd df = pd.DataFrame(index=['a', 'b', 'c', 'd', 'e', 'f'])

  • 数据可视化之二手房数据实战(一)2022-03-10 12:33:46

    1、导包 import pandas as pd from pyecharts.charts import Bar, Pie, Map, Line, Scatter from pyecharts import options as opts from pyecharts.render import make_snapshot from snapshot_selenium import snapshot from pyecharts.globals import CurrentConfig 2、读取

  • Pandas_stack和pivot实现数据透视2022-03-08 17:01:41

    """ 将列式数据变成二维交叉形式,便于分析,叫做重塑或者透视 1)经过统计得到多维度指标数据 2)使用unstack实现数据二维透视 3)使用pivot简化透视 4)stack,unstack,pivot的语法 """ import pandas as pd import numpy as np df = pd.read_csv( 'data/ratings.csv', sep=','

  • 用pandas将多个excel文件合并成一个大表2022-03-08 17:00:55

    1 import os 2 import pandas as pd 3 path = r'C:\Users\Administrator\Desktop\合并' 4 df_list =[] 5 for filename in os.listdir(path): 6 if filename[0] == '~': 7 continue 8 a = os.path.join(path, filename) 9

  • Python疫情数据分析,并做数据可视化展示2022-03-08 15:31:36

    采集流程 一. 明确需求 采集/确诊人数/新增人数 二. 代码流程 四大步骤 发送请求 获取数据 网页源代码 解析数据 筛选一些我想用的数据 保存数据 保存成表格 做数据可视化分析 开始代码 1. 发送请求 import requests # 额外安装: 第三方模块 url = 'h

  • pandas行专列数据塑型与长宽转换2022-03-06 22:35:22

    行专列数据塑型与长宽转换 import pandas as pd df = pd.read_clipboard(sep='\t') df.head() df_v2 = pd.melt(df, id_vars=["地 区"], var_name="年份", value_name="人口") df_v2 ##保存到本地 path = r"C:\Us

  • Pandas Series+DateFrame数据类型基础操作 与 Python中复杂数据类型转换关系2022-03-06 14:33:38

    Series import pandas as pd # 1)直接读取列表数据 s1 = pd.Series([1, 'a', 3.3, 66]) s1.index # 查看索引 s1.values # 获取值 # 2)指定索引读取 s2 = pd.Series([1, 'a', 5.2, 44], index=['a', 'b', 'c', 'd']) # 3)Python字典创建

  • Pandas 读取输出文件 + 数据查询2022-03-06 14:01:42

    1)读取输出文件 import pandas as pd # 1)读取csv df = pd.read_csv(path) df.head() # 查看前几行数据 df.shape # 查看数据的形状,返回(行数,列数) df.columns # 查看列名列表 df.index # 查看索引列 df.dtypes # 查看每列数据类型 df.to_csv(path) # 2)读取txt文件 df = pd.r

  • 数据分析-以买东西数据为例2022-03-06 13:07:31

    数据分析-以买东西数据为例 首先导入库: import numpy as np import pandas as pd import matplotlib.pyplot as plt %matplotlib inline 然后到数数据: df=pd.read_csv('./data/CDNOW_master.txt',header=None,sep='\s+',names=['use_id','order_dt',

  • pandas_设计样本(资产)组合2022-03-06 12:31:21

    目录 需求 设计-选择标的 设计-检验有效性 设计-计算风险与夏普比率 需求 某个客户需要9%的收益率,对该客户进行组合优化配置,设计适合该客户的金融产品雏形 设计-选择标的 选择10个标的,计算这10个标的的年化收益率、年化协方差 import pandas as pd import numpy as np import

  • 利用tushare 研究A股的动量效应2022-03-02 11:30:49

    利用tushare 研究A股的动量效应 一、数据获取预处理? 1、首选选择沪深300前1个月(这个时间戳可以更改)累积收益排名前十的股票,同时收益排名最差的10只股票;持有时间1个月之后检查他们的收益情况。 2、注意事项在用tushare获取股票数据的时候记得要进行前复权,这里可以参考官网 前

  • A股全自动化交易——从零到实盘20(完结)2022-03-01 19:33:34

    本文是“从零到实盘”系列的最后一篇文章,将介绍实现全自动实盘交易的最后一个步骤,即实现定时更新股票数据任务。 schedule模块安装 我们使用schedule来实现定时任务,首先需要安装schedule模块,在终端中输入以下命令安装: pip install schedule 主要代码分析 我们实现最终版本

  • 基于同步行为的反欺诈算法SynchroTrap实现细节2022-03-01 19:32:31

    上次分享了非常牛逼的不需要介质就能进行团伙挖掘的算法,大家都说是个好算法,但是实现细节还是有些问题。文章传送门:SynchroTrap-基于松散行为相似度的欺诈账户检测算法 由此可见,风控的实践大于算法,就像绘画,给我同样的材料,打死我都成不了梵高。所以风控一定要多看多试验。我这里

  • 机器学习笔记:偏度skew与峰度kurt2022-02-28 22:31:28

    一、总体 一般通过偏度和峰度对数据分布形态进行分析,与正态分布进行比较。 正态分布的偏度和峰度都看做零。 实际分析中,如果遇到峰度、偏度不为零情况,即表明变量存在左偏右偏,或者高顶平顶一说。 二、偏度 skewness 1.介绍 偏度(skewness),是统计数据分布偏斜方向和程度的度量,是统计数

  • Spark-sql实验5.12022-02-28 14:31:37

    将下列 json 数据复制到你的 ubuntu 系统/usr/local/spark 下,并保存命名为 employee.json。   { "id":1 ,"name":" Ella","age":36 } { "id":2,"name":"Bob","age":29 } { "id":3 ,"name"

  • 使用python发生此类错误 ValueError: endog must be in the unit interval.2022-02-28 11:33:42

    from functools import reduce import pandas as pd import statsmodels.api as sm import numpy as np from scipy.optimize import minimize df = pd.read_csv("pheno.asd", sep="\s+", header=0) gmat = np.loadtxt("test.agrm.mat_fmt")

  • python pandas loc布尔索引(指定条件下的索引)2022-02-27 18:30:02

    pandas loc的指定条件索引(布尔索引) pandas中的loc不仅仅可以用于直接的标签的索引,也可以用于指定条件的索引。 文章目录 1.准备数据2.单条件筛选3.多条件筛选 1.准备数据 首先准备一组数据: import pandas as pd df = pd.DataFrame({ 'AAA': [120, 101, 106, 117, 1

  • Pandas apply函数 计算日期相减2022-02-25 20:01:28

    参考:pandas apply() 函数用法 平时我们会经常用到日期的计算,比如要计算两个日期的间隔,比如下面的一组关于 wbs 起止日期的数据: wbs date_from date_to job1 2019-04-01 2019-05-01 job2 2019-04-07 2019-05-17 job3 2019-05-16 2019-05-31 job4 2019-05-20 2019-06

  • Python数据分析 | 基于Pandas的数据可视化2022-02-25 17:31:15

    作者:韩信子@ShowMeAI 教程地址:http://www.showmeai.tech/tutorials/33 本文地址:http://www.showmeai.tech/article-detail/150 声明:版权所有,转载请联系平台与作者并注明出处 大家在前面的教程中看到了Pandas进行数据分析的灵活操作,但同时作为一个功能强大的全能工具库,它也能非常

  • android两个日期的大小比较方式,现在整理一下几种方法2022-02-25 09:34:55

       String beginTime=new String("2017-06-09 10:22:22");     String endTime=new String("2017-05-08 11:22:22"); 1 直接用Date自带方法before()和after()比较       转成date格式     SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss")

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有