四、重复的原则

重复（replication）是消除非处理因素影响的又一重要手段。重复程度表现为试验例数（样本含量）的大小和重复次数的多少。试验例数越大或重复次数越多，则越能反映机遇变异的客观真实情况。但是，试验例数太大或试验次数太多，不仅会增加控制实验条件的困难，也会造成不必要的浪费。为此，必须在保证试验结果具有一定可靠性的条件下，确定最少的试验例数。因此，在科研设计中，要对试验例数的多少作出科学的估计，以满足数据处理的要求。

估计样本含量可以通过公式计算，也可通过查表，二者都需要事先确定：

①第一类错误的概率α，即检验水准。α越小所需样本含量越多。②检验效能 1-β，β为第二类错误的概率，1-β越大，所需样本含量越多。③对实验的精度要求，规定容许误差大小，容许误差或差值δ=μ1-μ2，容许误差小则辨别力高，实验所需的样本含量就更多。④观察指标的变异度，即变量的标准差，总体标准差σ或总体率π。指标的变异度大，抽样误差也大，所需样本数量也就越多。α、1-β和δ需要根据专业要求由研究者规定，σ或π 可根据经验或预备试验用样本标准差或样本率来估计。

统计学家根据有关计算公式编制了样本含量便查表，使用方便，但往往要结合内插法估计，或用偏大值估计。

下面介绍假设检验中常用的几种样本含量估计方法。

1.样本均数与总体均数比较（或配对比较），按式（12·1）计算。

 (u + u )  2

n =

 δ 

（12·1）

式中 n 为所需样本含量； s 为总体标准差σ的估计值；δ为容许误差， uα和 uβ由 t 界值表（ν=∝）查得，uα有单侧和双侧之分，uβ只取单侧值。

或直接查表 12-3 配对比较（t 检验）时所需样本含量（注意：此表亦可用于样本均数与总体均数比较的样本含量估计）。

例 12·3 用某药治疗矽肺患者，估计可增加尿矽排出量，其标准差为89.0mmol/L，若要求以α=0.05，β=0.10 的概率，能辨别出尿矽排出量平均增加 35.6mmol/L，问需用多少矽肺病人做试验？

本例δ=35.6，s=89，单侧α=0.05，uα=1.645，β=0.1，u0.1=1.282，代入式（12·1），

 (1.645 + 1.282) × 89 2

n = 

35.6

 = 53.5，取54

故可认为需治疗 54 个矽肺病人。即以 54 例进行试验，如该药确能增加尿矽排出量，则有 90%（即 1-β）的把握可得出有差别的结论。

查表 12-3，单侧 α=0.05，β=0.1，δ/σ=35.6/89=0.4，得 n=55，与上述计算结果相近。

2.两样本均数比较，按式（12·2）计算。

n = n = 2

(u + u )s2

（12·2）

1 2  

 

式中 n1 和 n2 分别为两样本所需含量，一般假设其相等；s 为两总体标准差σ的估计值，一般假设其相等；δ为两均数差值；uα和 uβ的意义同前。

或直接查表 12－4 两样本均数比较（t 检验）时所需样本含量。

例 12·4 在作两种处理动物的冠状静脉窦的血流量实验时，A 处理平均血流量增加 1.8 毫升/分钟，B 处理平均血流量增加 2.4 毫升/分钟。设两处

理的标准差相等，均为 1.0 毫升/分钟，α=0.05，β=0.10，若要得出两处理有差别的结论，需多少实验动物？

本例，按δ=2.4-1.8=0.6，s=1，双侧α=0.05，uα=1.960，β=0.1， u0.1=1.282，代入式（12·2），

(1.960 + 1.282) × 12

n1 = n2 = 2

0.6

 = 58.4，取59

或查表 12-4，双侧 α=0.05，β=0.1，δ/σ=0.6/1=0.6，得 n=60，与上述计算结果相近。

3.两样本率比较按式（12·3）计算。

(uα + uβ ) ² 2p(1 − p)

n = (p - p )²

（12·3）

式中 n 为两样本分别所需例数，p1 和 p2 分别为两总体率的估计值，p 为两样本合并率，p=（p1+p12）/2，uα和 uβ为ν=∝时，由 t 界值表中查得的t 值。

或直接查表 12-5，两样本率比较时所需样本含量。

例 12·5 拟研究某种新型防龋牙膏的效果，已知一般儿童中龋齿发生率约为 30% ，要求新型牙膏能使龋齿发生率降至 10%，设α=0.05，β=0.1，问普通牙膏和新型牙膏两组，每组需要多少儿童？

本例，p1=0.3，p2=0.1，p=（0.3+0.1）/2=0.2；查 t 界值表，ν=∝时，单侧 u0.05=1.645，单侧 u0.1=1.282，代入式（12·3），

(1.645 + 1.282) ² 2(0.2)(1− 0.2)

n =

(0.3 - 0.1)²

= 68.5，取69

故可认为每组需要儿童 69 例。

或查表 12-5，α=0.05，β=0.1，1-β=0.9，较小率 p2=10%，δ=p1- p2=30%-10%=20%，得 n=64，结果相近。