标签:清风 两个 变量 相关系数 建模 皮尔逊 线性相关 相关性
一、皮尔逊person相关系数
(一)、概念
皮尔逊相关系数可以看作为X和Y标准化后的协方差
(二)、使用条件
1.两个变量线性相关
(三)、易错点
1. 非线性相关也会导致线性相关系数很大
2. 离群点对相关系数的影响很大
3. 如果两个变量的相关系数很大也不能说明二者相关(可能是受到了异常值的影响)
4. 相关系数计算结果为0,只能说不是线性相关,但说不定会有更复杂的相关关系(非线性关系)
(四)、总结
1. 如果两个变量本身就是线性的关系,那么皮尔逊相关系数绝对值大的就是相关性强,小的就是相关性弱。
2. 在不确定两个变量是什么关系的情况下,即时算出皮尔逊相关系数,发现很大,也不能说明那两个变量线性相关,甚至不能说明它们相关,一定要画出散点图来观察。
(五)、对皮尔逊相关系数进行假设检验
(六)、对皮尔逊相关系数进行假设检验的条件
(七)、如何检验数据是否是正态分布?
1.正态分布JB检验
2.Shapiro-wilk夏皮洛-威尔克(3<=n<=50)
3Q-Q图(n较大)
二、斯皮尔曼spearman等级相关系数
三、两个相关系数的比较
标签:清风,两个,变量,相关系数,建模,皮尔逊,线性相关,相关性 来源: https://blog.csdn.net/qq_52268805/article/details/122839129
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。