四、重复的原则
重复(replication)是消除非处理因素影响的又一重要手段。重复程度表现为试验例数(样本含量)的大小和重复次数的多少。试验例数越大或重复次数越多,则越能反映机遇变异的客观真实情况。但是,试验例数太大或试验次数太多,不仅会增加控制实验条件的困难,也会造成不必要的浪费。为此,必须在保证试验结果具有一定可靠性的条件下,确定最少的试验例数。因此,在科研设计中,要对试验例数的多少作出科学的估计,以满足数据处理的要求。
估计样本含量可以通过公式计算,也可通过查表,二者都需要事先确定:
①第一类错误的概率α,即检验水准。α越小所需样本含量越多。②检验效能 1-β,β为第二类错误的概率,1-β越大,所需样本含量越多。③对实验的精度要求,规定容许误差大小,容许误差或差值δ=μ1-μ2,容许误差小则辨别力高,实验所需的样本含量就更多。④观察指标的变异度,即变量的标准差,总体标准差σ或总体率π。指标的变异度大,抽样误差也大,所需样本数量也就越多。α、1-β和δ需要根据专业要求由研究者规定,σ或π 可根据经验或预备试验用样本标准差或样本率来估计。
统计学家根据有关计算公式编制了样本含量便查表,使用方便,但往往要结合内插法估计,或用偏大值估计。
下面介绍假设检验中常用的几种样本含量估计方法。
1.样本均数与总体均数比较(或配对比较),按式(12·1)计算。
(u + u ) 2
n =
δ
(12·1)
式中 n 为所需样本含量; s 为总体标准差σ的估计值;δ为容许误差, uα和 uβ由 t 界值表(ν=∝)查得,uα有单侧和双侧之分,uβ只取单侧值。
或直接查表 12-3 配对比较(t 检验)时所需样本含量(注意:此表亦可用于样本均数与总体均数比较的样本含量估计)。
例 12·3 用某药治疗矽肺患者,估计可增加尿矽排出量,其标准差为89.0mmol/L,若要求以α=0.05,β=0.10 的概率,能辨别出尿矽排出量平均增加 35.6mmol/L,问需用多少矽肺病人做试验?
本例δ=35.6,s=89,单侧α=0.05,uα=1.645,β=0.1,u0.1=1.282, 代入式(12·1),
(1.645 + 1.282) × 89 2
n =
35.6
= 53.5,取54
故可认为需治疗 54 个矽肺病人。即以 54 例进行试验,如该药确能增加尿矽排出量, 则有 90%(即 1-β)的把握可得出有差别的结论。
查表 12-3,单侧 α=0.05,β=0.1,δ/σ=35.6/89=0.4,得 n=55,与上述计算结果相近。
2.两样本均数比较,按式(12·2)计算。
n = n = 2
(u + u )s2
(12·2)
1 2
式中 n1 和 n2 分别为两样本所需含量,一般假设其相等;s 为两总体标准差σ的估计值,一般假设其相等;δ为两均数差值;uα和 uβ的意义同前。
或直接查表 12-4 两样本均数比较(t 检验)时所需样本含量。
例 12·4 在作两种处理动物的冠状静脉窦的血流量实验时,A 处理平均血流量增加 1.8 毫升/分钟,B 处理平均血流量增加 2.4 毫升/分钟。设两处
理的标准差相等,均为 1.0 毫升/分钟,α=0.05,β=0.10,若要得出两处理有差别的结论,需多少实验动物?
本例,按δ=2.4-1.8=0.6,s=1,双侧α=0.05,uα=1.960,β=0.1, u0.1=1.282,代入式(12·2),
(1.960 + 1.282) × 12
n1 = n2 = 2
0.6
= 58.4,取59
或查表 12-4,双侧 α=0.05,β=0.1,δ/σ=0.6/1=0.6,得 n=60,与上述计算结果相近。
3.两样本率比较 按式(12·3)计算。
(uα + uβ ) 2 2p(1 − p)
n = (p - p )2
(12·3)
式中 n 为两样本分别所需例数,p1 和 p2 分别为两总体率的估计值,p 为两样本合并率,p=(p1+p12)/2,uα和 uβ为ν=∝时,由 t 界值表中查得的t 值。
或直接查表 12-5,两样本率比较时所需样本含量。
例 12·5 拟研究某种新型防龋牙膏的效果,已知一般儿童中龋齿发生率约为 30% ,要求新型牙膏能使龋齿发生率降至 10%,设α=0.05,β=0.1,问普通牙膏和新型牙膏两组,每组需要多少儿童?
本例,p1=0.3,p2=0.1,p=(0.3+0.1)/2=0.2;查 t 界值表,ν=∝时, 单侧 u0.05=1.645,单侧 u0.1=1.282,代入式(12·3),
(1.645 + 1.282) 2 2(0.2)(1− 0.2)
n =
(0.3 - 0.1)2
= 68.5,取69
故可认为每组需要儿童 69 例。
或查表 12-5,α=0.05,β=0.1,1-β=0.9,较小率 p2=10%,δ=p1- p2=30%-10%=20%,得 n=64,结果相近。