数理统计置信区间总结

2021-11-21 16:58:47 阅读：154 来源： 互联网

标签：总结置信区间 plt 数理统计 np import 单侧 data

一单个正态总体

二两个正态总体

三（0-1）参数的区间估计

一一个正态总体

这里面取值都是上alpah 分位数

待估参数	其他参数	枢轴量的分布	双侧置信区间	单侧上限	单侧下限
u	$\sigma^2$ 已知	$Z= \frac{\bar{x}-u}{\sigma/\sqrt{n}} \sim N(0,1)$	$\bar{x}\pm \frac{\sigma}{\sqrt{n}}Z_{\alpha/2}$	$\bar{x}+\frac{\sigma}{\sqrt{n}}Z_{\alpha}$	$\bar{x}-\frac{\sigma}{\sqrt{n}}Z_{\alpha}$
u	$\sigma^2$ 未知	$t=\frac{\bar{X}-u}{S/\sqrt{n}} \sim t(n-1)$	$\bar{x}\pm \frac{S}{\sqrt{n}}t_{\alpha/2}(n-1)$	$\bar{X}+\frac{S}{\sqrt{n}}t_{\alpha}(n-1)$	$\bar{X}-\frac{S}{\sqrt{n}}t_{\alpha}(n-1)$
$\sigma^2$	u未知	$\chi^2=\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$	$\begin{bmatrix} \frac{(n-1)S^2}{\chi^2_{\alpha/2}(n-1)} ,& \frac{(n-1)S^2}{\chi^2_{1-\alpha/2}(n-1)} \end{bmatrix}$	$\frac{(n-1)S^2}{\chi^2_{1-\alpha}(n-1)}$	$\frac{(n-1)S^2}{\chi_{\alpha}^2(n-1)}$

例：从一批灯泡中随机选取5个灯泡做寿命测试，测得寿命

1050 1100 1120 1250 1280

设灯泡服从正态分布，求寿命的平均置信水平为0.95的单侧置信区间下限

# -*- coding: utf-8 -*-
"""
Created on Sat Nov 20 20:54:34 2021

@author: cxf
"""
import numpy as np
from scipy.stats import t
import matplotlib.pyplot as plt


class Confidence():
    
    def GetData(self):
        
        data =[1050, 1100,1120,1250,1280]
        
        x = np.arange(1,len(data)+1)
        
        plt.bar(x, data,width=0.2, label='use year')
        plt.xlabel("item ")
        plt.ylabel("year")
        plt.legend()
        plt.show()
        return data
        
    
    def __init__(self):
        self.alpha = 0.05 #置信区间为0.95
        
        
    '''
    ddof= 1为样本标准差，否则为总体标准差
    '''
    def GetConfidence(self):
        
        data = self.GetData()
        n = len(data)
        x_bar = np.mean(data)
        s = np.std(data,ddof=1)
        
        
        
        v = t.isf(self.alpha,n-1)
        print("\n 样本均值 %5.2f  ,样本标准差 %5.2f  样本个数 %d , 上alpha 分位数%5.2f "%(x_bar, s,n,v))
        low = x_bar-s/np.sqrt(n)*v
        
        print("\n 单侧置信区间下限 u %5.2f"%low)


if __name__ == "__main__":
    
    Co = Confidence()
    
    Co.GetConfidence()
=======================================

 样本均值 1160.00  ,样本标准差 99.75  样本个数 5 , 上alpha 分位数 2.13 

 单侧置信区间下限 u 1064.90

二两个正态总体

待估参数	其他参数	枢轴量的分布	双侧置信区间	单侧上限	单侧下限
u1-u2	$\sigma_1^2,\sigma_2^2$ 已知	$Z=\frac{\bar{X}-\bar{Y}-(u_1-u_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}$	$\bar{X}-\bar{Y}\pm z_{\alpha/2}\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}$	$\bar{X}-\bar{Y}+Z_{\alpha}\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}$	$\bar{X}-\bar{Y}-Z_{\alpha}\sqrt{\sigma_1^2/n_1+\sigma_2^2/n_2}$
u1-u2	$\sigma_1=\sigma_2$ 未知	$t=\frac{\bar{X}-\bar{Y}-(u_1-u_2)}{S_w\sqrt{1/n_1+1/n_2}} \sim t(n_1+n_2-2);S_w^2=\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}$	$\bar{X}-\bar{Y}\pm t_{\alpha/2}(n_1+n_2-2)S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}$	$\bar{X}-bar{Y}+t_{\alpha}(n_1+n_2-2)S_W\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}$	$\bar{X}-\bar{Y}-t_{\alpha}(n_1+n_2-2)*S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}$
$\frac{\sigma_1^2}{\sigma_2^2}$	$u_1,u_2$ 未知	$F=\frac{S_1^2/S_2^2}{\sigma_1^2/\sigma_2^2} \sim F(n_1-1,n_2-1)$	$\frac{s_1^2}{s_2^2}\frac{1}{F_{\alpha/2}(n_1-1,n_2-1)},\frac{s_1^2}{s_2^2}\frac{1}{F_{1-\alpha/2}(n_1-1,n_2-1)},$	$\frac{S_1^2}{S_2^2}\frac{1}{F_{1-\alpha}(n_1-1,n_2-1)}$	$\frac{S_1^2}{S_2^2}\frac{1}{F_{\alpha}(n_1-1,n_2-1)}$

三（0-1）分布参数的区间估计

样本均值 u,方差 p(1-p)

枢轴量的分布:

$Z=\frac{n\bar{X}-np}{\sqrt{np(1-p)}} \sim N(0,1)$

$p_1=\frac{1}{2a}(-b-\sqrt{b^2-4ac}),p_2=\frac{1}{2a}(-b+\sqrt{b^2-4ac})$

$a = n+z_{\alpha/2}^2;b=(-2n\bar{X}+z_{\alpha}^2),c=n\bar{X}^2$

置信区间

$\begin{bmatrix} p_1 &p_2 \end{bmatrix}$

二项分布为

在概率论和统计学中，二项分布是n个独立的成功/失败试验中成功的次数的离散概率分布，其中每次试验的成功概率为p。这样的单次成功/失败试验又称为伯努利试验。实际上，当n=1时，二项分布就是伯努利分布。

比如KNN算法中，一般算法没有规定我们最终从N个数字里面取出来几个K数。

因为这K个数和样本欧式距离最接近，期望D(Xk)=0 ，为一个类型的。

比如样本的标签种类为5,则选择k中的随机一个样本跟数据本身的标签值p概率为

1/N。

从图1中可以看出，对于固定的n以及p，当k增加时，概率P{X=k}先是随之增加直至达到最大值，随后单调减少。可以证明，一般的二项分布也具有这一性质，且: [1]

当（n+1）p不为整数时，二项概率P{X=k}在k=[(n+1)p]时达到最大值； [1]
当（n+1）p为整数时，二项概率P{X=k}在k=(n+1)p和k=(n+1)p-1时达到最大值。

例子

# -*- coding: utf-8 -*-
"""
Created on Sun Nov 21 16:08:06 2021

@author: cxf
"""

import matplotlib.pyplot  as plt
import numpy as np
import scipy.misc as ms
from scipy.special  import comb ,perm

def GetP(p,m,n,cb):
    
    a = cb*np.power(p,n)*np.power(1-p,m-n)
    return a

def GetData(m,p):
    y =[]
    x = np.arange(0,m)
    
    for  n in range(m):        
         a = comb(m,n) #排列组合
         b = np.power(p,n)
         c = np.power(1.0-p,m-n)
         #print("cb ",False)
         d = a*b*c
         y.append(d)
         
         print("prob ",p)
    plt.scatter(x,y,c='r')
    plt.show()

def DrawTwo():
     a= 0
     
     GetData(100,0.2)
     
DrawTwo()

标签：总结,置信区间,plt,数理统计,np,import,单侧,data
来源： https://blog.csdn.net/chengxf2/article/details/121444691

本站声明： 1. iCode9 技术分享网（下文简称本站）提供的所有内容，仅供技术学习、探讨和分享；
2. 关于本站的所有留言、评论、转载及引用，纯属内容发起人的个人观点，与本站观点和立场无关；
3. 关于本站的所有言论和文字，纯属内容发起人的个人观点，与本站观点和立场无关；
4. 本站文章均是网友提供，不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属；如您发现该文章侵犯了您的权益，可联系我们第一时间进行删除；
5. 本站为非盈利性的个人网站，所有内容不会用来进行牟利，也不会利用任何形式的广告来间接获益，纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

ICode9

数理统计置信区间总结