ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

Python数据分析工具

2021-07-07 15:03:26  阅读:207  来源: 互联网

标签:数据分析 QR Python 相关系数 IQR 规范化 工具 数据 QL


一、Python数据分析工具

二、数据探索

一、 对数据的质量分析

异常值的分析:

  1. 简单的统计量分析:查看最大最小值是否在合理范围

2.3δ原则,在正态分布下异常值被定义为一组定值与平均值的距离超过3倍的标准差。

3.箱形图分析:

异常值被定义为小于QL-1.5IQR 或大于QR+1.5IQR

QL是所有数据的下四分位,QR是所有数据的上四分位。IQR是QR-QL

DataFrame中describe()已经给出了基本的统计

二、 数据特征分析

  1. 可以使用pandas、matplotlib绘制统计图

散点图矩阵可以分析每两个变量的关系。

2 .计算相关系数

①Pearson相关系数

②Spearman秩相关系数

③判定系数

使用pandas的corr()计算相关系数

绘制条形图和折线图

三、数据预处理

缺失

![](https://www.icode9.com/i/ll/?i=20190417165230662.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2R1X2x1bg==,size_16,color_FFFFFF,t_70)

插值法主要用两类:

拉格朗插值(python scipy库中有)、牛顿插值。

数据变换

使用简单的函数如:x'=x^2 x'=sqrt(x) x'=log(x)

规范化

①最小最大规范化

②零-均值规范化:将数据处理成均值为0,标准差为1

③小数定标规范化

连续属性离散化

数据规约 :产生更小保持原数据完整性的新数据集。

主要方法有合并属性、决策树归纳、主成分分析

数值规约 :????

![](https://www.icode9.com/i/ll/?i=20190417171314588.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2R1X2x1bg==,size_16,color_FFFFFF,t_70)

四、挖掘建模

1、分类 预测

2、聚类分析

在这里插入图片描述

标签:数据分析,QR,Python,相关系数,IQR,规范化,工具,数据,QL
来源: https://www.cnblogs.com/lj-C/p/14981483.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有