二、样本容量确定

在抽样调查中,一般从调查总体中选取部分个体组成样本,作为调查对象。样本容量越大,选择的调查对象越多,样本的特性越接近总体特性,产生的偏差越小。但随之而来的调查工作量增大,时间和费用增加,所以对样本数的选择既不能太大,也下宜太小。

在抽样调查中常根据要求的置信度(1—a)和允许的偏差 d 进行计算, 来确定样本容量 n 的大小。

偏差 d 表示样本平均值 X 与总体平均值μ之差,即:

d=│X - μ│

μ的置信区间为:

n δ n δ

X − Zα/ 2

1− N · ≤μ≤X + Zα/ 2 1 − N ·

取等号得:

n δ

|X − μ|= Zα/2 1 − N ·

即:

d = Z

δ

α/2 ·

( Zα / 2δ )2

∴n = d

1 + 1 ( Zα / 2δ )2

N d

式是:N 为总体数。

Zα/2 由要求的置信度来确定。δ为总体标准差。

一样抽样时,δ是未知数,且 d 只是反映绝对偏差的大小。同一个 d 值, 当总体均值μ大时,可能被视为允许;而当μ值小时,可能破视为不允许, 所以采用 d 的相对值 d 较为合理。d=d/μ,称为允许偏差率。同样总体标准差也应用其相对值 C 表示。C=δ/μ,被称为总体变异系数。用 C 和 d 对上式进行代换,可得样本容量 n 的计算公式:

(Z c / d) 2

N = α/2

1 + 1 [ Zα/ 2C]2

N d

例如,某机床出口公司存国外的经常用户为 10,000 户,公司为对未来市场状况进行调研,决定对经常用户进行抽样调查。要求调查结果能保证:C

=0.2,d=0.05,置信度为 95%,试确定样本容量。

[ Zα /2 C]2

解:n = d

1+ 1 [ Zα /2 C]2

d

(1.96(0.2) )2

= 0.05 =

61.47

1

1 + 10000

(1.96(0.2) ) 2

0.05

61.47

1+ 10000

≈579

说明选取 579 户作为调查对象可以满足调查结果的要求。