ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

抽样调查之分层抽样

2022-01-15 14:32:41  阅读:166  来源: 互联网

标签:nh 抽样调查 sum 各层 估计 分层抽样 样本量 估计量


1、在某工业系统所属企业中,中型100个,小型400个。采用简单随机抽样,以企业为单元,分别从两类企业中抽取3个企业和5个企业,记录1990年的工业总产值(单位:千元)。3个中型企业分别为12300、11500、9800;5个小型企业分别为3200、5600、2300、4200、3600.试估计工业系统1990年的工业总产值。

【解题过程】写清楚解题过程,公式用公式编辑器输入。
解:由题意得,把工业系统所属企业总体划分成两层,分别是中型企业和小型企业,L=2。
总体单元数N=500,各层单元总数分别为N1=100,N2=400,
每层权数分别为:W1=N1/N=0.2,W2=N2/N=0.8,
各层样本量分别为:n1=3,n2=5。
第一层样本均值的样本方差为:
在这里插入图片描述

第二层样本均值和样本方差为:
在这里插入图片描述

工业系统1990年的工业总产值的估计为:
在这里插入图片描述

工业系统1990年的工业总产值估计量的方差估计为:
在这里插入图片描述

估计量的标准差估计为:
在这里插入图片描述

【R语言代码】

N=500;
Nh=c(100,400);
W=Nh/N;
nh=c(3,5); 
f=nh/Nh; #各层抽样比
yh1=c(12300,11500,9800);#各层的样本
yh2=c(3200,5600,2300,4200,3600);
yhmean=c(mean(yh1),mean(yh2));yhmean; #各层的样本均值
s2h=c(var(yh1),var(yh2));s2h;#各层的样本方差
Y=N*sum(W*yhmean);Y;#总体总值的估计
vY=N^2*sum(W^2*s2h/nh*(1-f));vY;#总值估计量的方差的估计
sdvY=sqrt(vY);sdvY;#总值估计量的标准差估计

【输出结果】
在这里插入图片描述

故该工业系统1990年工业总值估计为2632000千元,估计量的方差估计为53049533333,估计量的标准差估计为230324.8千元。

2、某厂有三个生产车间,现分别从每个车间中抽取10%的工人,分别为60、50、40,征询工人对该厂某项议案的意见,反对人数所占比例分别为10%、20%、30%。3估计全厂工人反对该项议案的人数所占的比例。

【解题过程】写清楚解题过程,公式用公式编辑器输入。
解:由题意得,把工厂总体划分为三层L=3,每个车间一层。
每层的样本量分别为:n1=60,n2=50,n3=40,总样本量为:n=150。
采用样本量按比例分配,第h层权数Wh=Nh/N=nh/n,各层权数分别为:
W1=n1/n=0.4,W2=n2/n=0.33,W3=n3/n=0.27。
各层反对人数所占比例分别为:p1=0.1,p2=0.2,p3=0.3。
全厂工人反对该议案的人数所占比例估计为:
在这里插入图片描述

全厂工人反对该议案的人数所占比例估计量的方差估计为:
在这里插入图片描述

估计量的标准差估计为:
在这里插入图片描述
【R语言代码】

nh=c(60,50,40); ##各层的样本量
n=sum(nh); #总样本量
f=rep(0.1,3); #各层抽样比
W=round(nh/n,2);W;#各层层权
p=c(0.1,0.2,0.3);#样本中各层工人反对议案的人数所占比例
Pst=sum(W*p);Pst;#总体比例的估计
vPst=sum(W^2/nh*(1-f)*(nh*p*(1-p)/(nh-1)));vPst;#估计量方差的估计
sdvPst=sqrt(vPst);sdvPst; #估计量的标准差估计

【输出结果】
在这里插入图片描述

故全厂工人反对该议案的人数所占比例估计为18.7%,估计量的方差估计为0.0008929783,标准差估计为0.02988274。

3、已知总体数据如表,拟估计总体均值,精度要求估计量的方差不超过0.1。若进行分层随机抽样,分别采用尼曼分配和比例分配,分别计算总样本量和各层样本量。

层号h各层总体单元数 Nh各层标准差Sh
125010
27508
合计1000

【解题过程】写清楚解题过程,公式用公式编辑器输入。
解:由题意得,把总体划分为两层,L=2。
总体单元数N=1000,各层单元总数分别为:N1=250,N2=750,
每层权数分别为:W1=N1/N=0.25,W2=N2/N=0.75,
已知计量的方差不超过0.1,V=0.1;每层标准差分别为:S1=10,S2=8。
当按尼曼分配时:
总样本量为:
在这里插入图片描述

各层样本量为:

在这里插入图片描述

当按比例分配时:
总样本量为:
在这里插入图片描述

各层样本量为:

在这里插入图片描述

【R语言代码】

Nh=c(250,750); #各层单元数
N=sum(Nh); #总体单元数
Wh=Nh/N;Wh;#各层层权
Sh=c(10,8); #各层标准差
vY=0.1; #估计量方差限度
n0=ceiling((sum(Wh*Sh))^2/vY); n0;#尼曼分配时总样本量
n=ceiling(n0/(1+(sum(Wh*Sh^2))/(sum(N*vY))));n;#调整的总样本量
nh=n*Wh*Sh/sum(Wh*Sh); #尼曼分配各层样本量
nh
n0p=ceiling(sum(Wh*Sh^2)/vY); n0p;#比例分配时总样本量
np=ceiling(n0p/(1+(sum(Wh*Sh^2))/(N*vY))); np;#调整的总样本量
nh=np*Wh; #比例分配各层样本量
nh

【输出结果】
在这里插入图片描述

故当按尼曼分配时,总样本量418,各层样本量分别为122.9412和295.0588,即大约为123和295;
当按比例分配时,总样本量422,各层样本量分别为105.5和316.5,即大约为105和316。

标签:nh,抽样调查,sum,各层,估计,分层抽样,样本量,估计量
来源: https://blog.csdn.net/gezongbo/article/details/122509667

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有