ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

数据分析知识扩展

2022-06-28 02:01:13  阅读:267  来源: 互联网

标签:数据分析 样本 frac 偏度 sum 知识 扩展 mu 峰度


弗里德曼-迪亚科尼斯规则

在统计学中,Freedman-Diaconis规则用于确定直方图中的条柱宽度, 它以David A.Freedman和Persi Diaconis的名字命名。该规则定义:

\[条柱宽度 = 2 \times \frac{IQR}{\sqrt[3]{n}} \]

其中,IQR是四分位距,n是观测样本数目。

偏度(Skewness)

偏度用来度量随机变量概率分布的不对称性。

\[b1=\frac{m_3}{s^3}=\frac{\frac{1}{n} \sum_{i=1}^{n}(x- \mu)^3}{[\frac{1}{n-1} \sum_{i=1}^{n}(x- \mu)^2]^{3/2}} \]

\[g1=\frac{m_3}{m_2^{3/2}}=\frac{\frac{1}{n} \sum_{i=1}^{n}(x- \mu)^3}{[\frac{1}{n} \sum_{i=1}^{n}(x- \mu)^2]^{3/2}} \]

其中,\(\mu\)是样本均值,\(s\)是样本标准差,\(m_2\)是(偏置)样本的第二中心矩,\(m_3\)是样本的第三中心矩。

样本偏度的另外一个定义是:

\[G = \frac{k_3}{k_2^{3/2}} = \frac{n^2}{(n-1)(n-2)}b_1=\frac{\sqrt{n(n-1)}}{n-2}g_1 \]

偏度是一种统计描述,可与直方图和正态分位数图结合使用,以表征数据或者分布。

偏度表示分布与正态分布的偏差的方向和相对大小。

偏度的取值范围:\((-\infty, \infty)\)

当偏度$<$0时,概率分布偏左。

当偏度\(=0\)时,数据分布服从正态分布。

当偏度\(>0\)时,概率分布右偏。

皮尔逊第一偏度系数(众数偏度)

\[\frac{平均值-众数}{标准差} \]

皮尔逊第二偏度系数(中位数偏度)

\[\frac{3\times{(平均值 - 中位数)}}{标准差} \]

这些系数不提供偏度类型信息。

峰度(Kurtosis)

峰度和偏度一样,也是一种统计描述。峰度描述了概率分布的形状。对于此度量,较高的峰度对应较大偏差或者异常值的极端性。

\[g2=\frac{1}{n} \sum_{i=1}^{n}(\frac{x- \mu}{\sigma})^4-3 \]

\[g2=\frac{m_4}{m_2^{2}}-3=\frac{\frac{1}{n} \sum_{i=1}^{n}(x- \mu)^4}{[\frac{1}{n} \sum_{i=1}^{n}(x- \mu)^2]^{2}}-3 \]

标准无偏估计:

\[G_2=\frac{n-1}{(n-2)(n-3)}[(n+1)g2+6] \]

在非正态化分布中常带有偏见。

标签:数据分析,样本,frac,偏度,sum,知识,扩展,mu,峰度
来源: https://www.cnblogs.com/mysterygust/p/16418118.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有