使用2个样本Kolmogorov Smirnov检验,我的p值为0.0.
>>>scipy.stats.ks_2samp(dataset1, dataset2)
(0.65296076312083573, 0.0)
查看2个数据集的直方图,我非常有信心它们代表两个不同的数据集.但是,真的,p = 0.0?这似乎没有意义.它不应该是一个非常小但正数吗?
我知道返回值是numpy.float64类型.这与它有关吗?
编辑:
数据在这里:https://www.dropbox.com/s/jpixhz0pcybyh1t/data4stack.csv
scipy.version.full_version
'0.13.2'
解决方法:
是的,概率非常小:
>>> from pprint import pprint
>>> pprint ([(i, scipy.stats.ks_2samp(dataset1, dataset2[:i])[1])
... for i in range(200,len(dataset2),200)])
[(200, 3.1281733251275881e-63),
(400, 3.5780609056448825e-157),
(600, 9.2884803664366062e-225),
(800, 7.1429666685167604e-293),
(1000, 0.0),
(1200, 0.0),
(1400, 0.0),
(1600, 0.0),
(1800, 0.0),
(2000, 0.0),
(2200, 0.0),
(2400, 0.0)]
标签:python,statistics,scipy 来源: https://codeday.me/bug/20190718/1491780.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。