卡方测验
(x2test,chi-squared test)测定实测值与理论值间符合程度的一种统计方法。如发现实测值与理论值有差异时,就需确定该差异是由于随机抽样误差还是由于理论假说有问题而引起的。通常首先建立无效假说,即认为观测值与理论值的差异是由于随机误差所致;再确定由于随机误差而导致该特定差异的概率;最后根据该概率作出相应的结论,如该概率大于某特定概率标准(即显著水准,生物统计学上一般定为 0.05),则认为无效假设成立, 即实测值与理论值的差异是由于随机误差引起的,进而得出实验值与理论值相符合的结论。以下结合例子说明 x2 测验的分析过程。大麦的六棱有芒品种与二棱无芒品种杂交,F2 代的结果为:二棱有芒 132 株,六棱有芒 38 株,二
棱无芒 42 株,六棱无芒 14 株,试问这两个性状是否独立遗传,即该四种表型数之比是否符合 9∶3∶3∶1 的理论比?(1)建立无效假设,假定实验值与理论值的差异是由于随机误差造成的,即实验数据均取自上述四种表型的比数为 9∶3∶3∶1 的总体。(2)计算差异度量值 x2 值,以便对无效假设进行检验,其公式为
n (O − E )2
x2 ( n −1)
= ∑ i i
i =1 Ei
其中 x2 为差异度量值,Oi 为第 i 类观察数值,Ei 为第 i 类理论值,n 为类型数,n-1 为自由度(df)。本例观察总数为 226 株,E1=226×9/16=127.125 株,E2=E3=226×3/16=42.375 株,E4=226×1/16=14.125 株,得下表:
表型项目 |
二棱有芒 |
二棱无芒 |
六棱有芒 |
六棱无芒 |
---|---|---|---|---|
O |
132 |
42 |
38 |
14 |
E |
127.125 |
42.375 |
42.375 |
14.125 |
O — E |
4.875 |
-0.375 |
-4.375 |
-0.125 |
( O — E ) 2 |
23.7656 |
0.1406 |
19.1406 |
0.0156 |
( O — E ) 2/E |
0.1869 |
0.0033 |
0.4517 |
0.0011 |
X2 |
0.643 |
(3)从无效假设出发,根据实得的 x2 值与自由度查 x2 表,可确定因随机误差造成该差异度量值(x2=0.643)的概率 P,x2 表见下(这里仅列出 10 个自由度):
不同 X2 值和不同自由度时的 P 值
P df |
0.99 |
0.95 |
0.90 |
0.80 |
0.70 |
0.50 |
0.30 |
0.20 |
0.10 |
0.05 |
0.01 |
---|---|---|---|---|---|---|---|---|---|---|---|
1 |
0.00016 |
0.04 |
0.016 |
0.064 |
0.148 |
0.455 |
1.074 |
1.642 |
2.706 |
3.841 |
6.635 |
2 |
0.0201 |
0.103 |
0.211 |
0.446 |
0.713 |
1.386 |
2.408 |
3.219 |
4.605 |
5.991 |
9.210 |
3 |
0.115 |
0.352 |
0.584 |
1.005 |
1.424 |
2.366 |
3.665 |
4.642 |
6.251 |
7.815 |
11.345 |
4 |
0.297 |
0.711 |
1.064 |
1.649 |
2.195 |
3.357 |
4.878 |
5.989 |
7.779 |
9.488 |
13.277 |
5 |
0.554 |
1.145 |
1.610 |
2.343 |
3.000 |
4.351 |
6.064 |
7.269 |
9.236 |
11.070 |
15.086 |
6 |
0.872 |
1.635 |
2.204 |
3.070 |
3.828 |
5.345 |
7.231 |
8.588 |
10.645 |
12.592 |
16.812 |
7 |
1.239 |
2.167 |
2.833 |
3.822 |
4.671 |
6.346 |
8.783 |
9.803 |
12.017 |
14.067 |
18.475 |
8 |
1.646 |
2.733 |
3.490 |
4.594 |
5.527 |
7.344 |
9.524 |
11.030 |
13.362 |
15.507 |
20.090 |
9 |
2.088 |
3.325 |
4.168 |
5.380 |
6.393 |
8.343 |
10.656 |
12.242 |
14.684 |
16.919 |
21.666 |
10 |
2.558 |
3.940 |
4.865 |
6.179 |
7.627 |
9.342 |
11.781 |
13.442 |
15.987 |
18.307 |
23.209 |
表中第一列为自由度(df),第一行为 P 值,表中所列的数值为不同的 df 和 P 所对应的 x2 临界值。当 df=4-1=3,实测 x2=0.643 时,查得 0.80<P< 0.90。(4)判断,查表所得的 P 值可作为接受或拒绝无效假说的依据,若由于随机误差所造成的差异度量值 x2 值的概率 P≤0.05 或实得 x2 值≥x2
(0.05)临界值时,则认为实验值与理论值间的差异显著,拒绝无效假设, 进而得出实验值与理论值不符合的结论。相反,如果 P>0.05 或实得 x2 值< x2(0.05)临界值,则认为该差异不显著,接受无效假设,可得出实验值与理论值相符合的结论。本例 0.80<P<0.90,即 P>0.05,或实得 x2=0.643
<x2(0.05)=7.815 临界值,所以实验观察值与理论值间的差异不显著,接受无效假设,即上述四种表现型数比符合 9∶3∶3∶1,因而属独立遗传。