四、总体均数的假设检验(t 检验)
现介绍总体均数的假设检验(t 检验)。
- 总体均数的假设检验(t 检验)的基本思想 总体均数的假设检验(t 检验)有 2 个目的:①推断单个总体均数μ是否等于已知总体均数μ0,设从均数为μ的总体抽取 1 个样本,样本均数为 ;②推断两个总体均数μ1
和μ2 是否相等,设从每个总体抽取1个样本,样本均数为X1和X 2 。
造成X和μ0 或X1和X 2 的差别有2种情况:①完全由抽样误差造成,即μ=μ0 或μ1=μ2,这种情况差别相对小,称为差别无显著性;②除了由抽样误差造成外,还由总体均数的差别造成,即μ≠μ0 或μ1≠μ2,这种情况差别相对大,称为差别有显著性。因此假设检验也可称为显著性检验
(significance test),检验X和μ 0 或X1 和X 2 的差别有无显著性是手段,推 断μ和μ0 或μ1 和μ2 是否相等是目的。其检验统计量为 t,故亦称为 t 检验。检验的一般步骤如下(对照后例阅读):
- 作出总体均数(μ)或其差别(μ1-μ2)的假设,确定检验水准(α):
检验假设(也称无效假设)为 H1:μ=μ0(或μ1=μ2)。检验假设的对立面备择假设为 H0,一般选用双侧μ≠μ0 (或μ1≠μ2);如果某一侧μ<μ0
(或μ1<μ2)或μ>μ0(或μ1>μ2)凭理论或经验判定实际不可能存在, 或无实际价值、研究者不关心,则选用单侧μ>μ0(或μ1>μ2)或μ<μ
0(或μ1<μ2)。给抽样误差概率按双侧或单侧确定某个水准,称为检验水
准(size of a test),亦称显著性水准(significance level),定为小概率,一般定α=0.05,如要减小α则可定α=0.01。本书例题采用单侧检验予以说明,采用双侧检验则省去说明。
-
根据检验假设(H0),计算检验统计量(t)值:选用什么检验统计量,决定于总体类型和要推断的总体参数。推断正态总体均数,当总体标准差未知时,用
t 检验(若总体标准差已知,则用 u 检验)。根据检验假设所定求 t 值的公式计算 t 值。
-
根据检验统计量(t)值,以检验水准(α)判断是否拒绝检验假设(H 0
):如果H 0 成立,则X和μ0 (或X1和X 2 )的差别完全是抽样误差造成的,可用所求得的 t 值以外(双侧或单侧)的 t 分布曲线以下的面积,即概率 P 值来衡量。表 7-9 的 t 界值表有双侧和单侧的 P=0.05 和 P=0.01,求 P
值可得出 P>0.05、P≤0.05 和 P≤0.01。若 t≥tα,v(由于 t 界值是取正值,
当求得的 t 值为负时,则取|t|),即 P≤α,则按α水准拒绝
H 0 ,接受H 1,认为X和μ 0 (或X1和X 2 )的差别有显著性,即认为μ≠μ 0
(指双侧,或μ1≠μ2)。拒绝 H0 所冒犯错误(无差别判断为有差别)的风险为小概率α。若 t<tα,v,即 P>α,由于接受 H0 所冒犯错误(有差别判断为无差别)的概率未知,故一般说成则按α水准不
拒绝H 0 ,认为X和μ 0 ( 或X1和X 2 )的差别无显著性,即尚不能认为μ≠μ 0
(或μ1≠μ2)。
- 样本均数和总体均数比较的 t 检验 从正态总体 N(μ,σ)随机抽取含量 n 的样本,推断μ是否等于μ0(一般为理论值或标准值,如正常人该指标的均数)。作 和μ0 比较的 t 检验,用(7·18)式计算 t 值(式中μ为μ0),ν=n-1。
例 7·19 已知健康成年男子的脉搏均数为 72 次/分。某医生在一山区抽样调查了 25 名健康成年男子,求得其脉搏均数为 74.2 次/分,标准差为
- 次/分。问该山区成年男子的脉搏均数是否高于一般成年男子的脉搏均数?
已知一般成年男子脉搏数总体的均数μ0 为 72 次/分,设山区成年男子脉搏数总体的均数为μ,假设为:
H0:μ=72 次/分
H1:μ>72 次/分单侧α=0.05
今μ0 =72次 / 分,n = 25,X = 74.2次 / 分,s = 6.5次 / 分。据(7·18)
式有
t = 74.2 − 72 = 1.692
6.5 / 25
v = 25 − 1 = 24
查 t 界值表得 P>0.05。按α=0.05 水准不拒绝 H0,尚不能认为山区成年男子的脉搏均数高于一般成年男子的脉搏均数。
- 配对差值均数和总体均数0 比较的t 检验 推断两个总体均数是否相等
有配对设计和成组设计,先介绍配对设计。医学研究的配对有同源配对和异源配对。同源配对为自身对照,是同一个体的处理前和后(如病人治疗的前和后)、两种处理方法(如血液化验的甲法和乙法)等配对或对照;异源配对是将两个个体按一些影响研究结果指标的因素齐同配成对子,如将性别相同、年龄、生活、劳动条件相近的两个人配成对子,同对的两个个体每个个体给予一种处理。配对设计资料的 t 检验相对于成组设计资料的 t 检验,如果样本含量相同,可提高两个总体均数差别的假设检验的检验效能(power of atest)——若两个总体均数有差别通过假设检验而判别有差别的概率;如果使检验效能相同,则可减少样本含量。
从正态总体 N(μ1,σ1)和 N(μ2,σ2)配对抽取 n 对变量值,配对差值 d=Xd-Xd 服从正态分布 N(μd,σd),其中μd=μ1-μ2,配对
成功会使σ2 <σ 2 + σ 2 。配对差值均数的标准误为σ = σ /
n,其
d 1 2 d d
样本估计值为sd = sd / n。推断μ1 是否等于μ 2 。即推断μ d 是否等于0,
作d和0比较的t检验,据(7·18)式,计算t值的等价公式为
t = d − 0 =
d
v = n − 1(7·20)
例 7·20 用克矽平治疗 10 名矽肺患者,治疗前后血红蛋白含量如表7-10。问矽肺患者经克矽平治疗后血红蛋白含量是否有改变?
设矽肺患者治疗后血红蛋白含量总体的均数为μ1,原来血红蛋白含量总体的均数为μ2,μd=μ1-μ2,假设为:
H0:μd=0 H1:μd≠0
α=0.05 今 n=10,∑d=68,∑d2=2900,
d = 68 = 6.8(g / L) 10
据(7·20)式有
sd =
t = 6.8
16.5 / 10
= 16.5(g / L)
= 1.303
v = 10 − 1 = 9
查 t 界值表得 P>0.05。按α=0.05 水准不拒绝 H0,尚不能认为矽肺患者经克矽平治疗后血红蛋白含量有改变。
表 7-10 10 名矽肺患者克矽平治疗
前后血红蛋白含量( g/L )
编号 血红蛋白含量 治疗后 X1 治疗前 X2
d=X1-X2 d2
1 |
140 |
113 |
27 |
729 |
---|---|---|---|---|
2 |
138 |
150 |
-12 |
144 |
3 |
140 |
150 |
-10 |
|
1004 |
135 |
135 |
0 |
0 |
5 |
135 |
128 |
7 |
49 |
6 |
120 |
100 |
20 |
400 |
7 |
147 |
110 |
37 |
1369 |
8 |
114 |
120 |
-6 |
36 |
9 |
138 |
130 |
8 |
64 |
10 |
120 |
123 |
-3 |
9 |
合计 —— —— 68 2900
例 7·21 某单位研究饮食中缺乏维生素 E 与肝中维生素 A 含量的关系, 将同种属的大白鼠按性别相同,年龄、体重相近配成 8 对,并将每对中的两头动物随机分到正常饲料组和维生素 E 缺乏组,然后定期将大白鼠杀死,测得其肝中维生素 A 的含量如表 7-11。问不同饲料的大白鼠肝中维生素 A 含量有无差别?
设正常饲料的大白鼠肝中维生素 A 含量总体的均数为μ1,维生素 E 缺乏的大白鼠肝中维生素 A 含量总体的均数为μ2,μd=μ1-μ2,假设为:
H0 :μd=0
H1:μd≠0
α=0.05 今 n=8,∑d=68.1,∑d2=808.67,
d = 68.1 = 8.51(μmol / L) 8
808.67 − 68.12 / 8
sd =
据(7·20)式有
8 − 1
= 5.72(μmol / L)
t = = 4.208
ν=8-1=7
查 t 界值表得 P<0.01。按α=0.05 水准拒绝 H0,接受 H1,认为不同饲料的大白鼠肝中维生素 A 含量有差别,正常饲料的较高。
表 7-11 不同饲料组大白鼠肝中维生素 A 含量(μ mol/L )
大白鼠对号
肝中维生素 A 含量
d=X1-X2 d2
正常饲料 X1 |
维生素 E 缺乏 X2 |
|||
---|---|---|---|---|
1 |
37.2 |
25.7 |
11.5 |
132.25 |
2 |
20.9 |
25.1 |
-4.2 |
17.64 |
3 |
31.4 |
18.8 |
12.6 |
158.76 |
4 |
41.4 |
33.5 |
7.9 |
62.41 |
5 |
39.8 |
34.0 |
5.8 |
33.64 |
6 |
39.3 |
28.3 |
11.0 |
121.00 |
7 |
36.1 |
26.2 |
9.9 |
98.01 |
8 |
31.9 |
18.3 |
13.6 |
184.96 |
合计 |
—— |
—— |
68.1 |
808.67 |
- 两个样本均数比较的 t 检验 成组设计用 t 检验,理论上要求两个正态总体方差(或标准差)相等。由于一群变量值都加一个常数,只改变其均数, 而不改变其方差,可以认为自然的或人为的特定因素对某个指标的影响,不会改变该指标的方差,因此在很多实际应用情况,两个总体方差相等或近似相等的条件常能满足。
从正态总体 N(μ1,σ)和 N(μ2,σ)分别抽取含量 n1 和 n2 的样
本,两个样本均数差值X1 − X 2 服从正态分布N( μ1 - μ 2 ,σ X − σ X )其中
σ X1 −X2 =
(7·21)
σ X−X 2 为两个均数差值的标准误,其样本估计值为
sX1−X2 =
(7·22)
式中S2 为两个样本的合并方差,是σ 2的点估计,计算公式为
∑X 2 − (∑
X )2 / n + ∑X 2 − (∑X
)2 / n
Sc =
n1 + n2 − 2
(7·23)
若已算出两个样本的标准差或方差,这时s2可用下式计算
(n − 1)s2 + (n − 1)s2
s2 = 1 1 2 2
(7·24)
c n + n − 2
1 2
当μ1=μ2 时的 t 变量为
t = X1 − X 2 =
X1−X2
X1 − X2
v = n
1 + n2 − 2
(7·25)
v为两个样本方差s2 和s2 的自由度之和,故v = n − 1
- n − 1 = n + n
- 2。
1 2 1 2 1 2
推断μ1是否等于μ 2 ,作X1和X 2 比较的t检验,用(7·25)式计算t
值。
例 7·22 某克山病区抽样测得 11 例急性克山病患者和 13 名健康人的血磷值如表 7-12。问急性克山病患者和健康人的血磷值是否不同?
设急性克山病患者血磷值总体的均数为μ1,健康人血磷值总体的均数为 μ2,假设为:
H0:μ1=μ2 H1:μ1≠μ2 α=0.05
今 n = 11,∑X = 16.73,∑ X2 = 27.2239;n = 13,∑X = 14.10,
1 1 1 2 2
∑X2 = 17.4316 。
据(7·25)式有
t = 1.521 − 1.085 0.1781(14 / 11+ 1 / 13)
= 2.522
v = 11 + 13 − 2 = 22
查 t 界值表得 P<0.05。按α=0.05 水准拒绝 H0,接受 H1,认为该地急性克山病患者和健康人的血磷值不同,患者较高。
表 7-12 11 例急性克山病患者与 13 名
健康人的血磷值( mmol/L )
1
例 7·23 某地抽查了 25~29 岁正常人群的红细胞数,其中男性 156 人, 得均数为 4.651×1012/L,标准差为 0.548×1012L;女性 74 人,得均数为 4.222
×1012/L,标准差为 0.442×1012L。问该人群男、女的红细胞数有无差别? 设该人群男性红细胞数总体的均数为μ1,女性红细胞数总体的均数为μ
2,被检假设为:
H0:μ1=μ2 H1:μ1≠μ2 α=0.05
今n1 = 156, X1 = 4.651,s1 = 0.548; n 2 = 4.222, X 2 = 4.222,
(156 − 1) × 0.5482 + 74 − 1(× 0.4422 )
s2 = 0.442.
s2 =
据(7·25)式有
t =
156 + 74 − 2
4.651 − 4.222
0.2667(1 / 156 + 1 / 74)
= 0.2667
= 5.885
v = 156 + 74 − 2 = 228
查 t 界值表(取靠近 228 的 v=200)得 P<0.01。按α=0.05 水准拒绝 H0, 接受 H1,认为该人群男、女的红细胞数有差别,男高于女。最后说明两个样本几何均数比较的 t 检验,目的是推断两个总体几何均数是否相等。原
变量为X,令Y = lgX。求Y1 和Y2 ,则lgG 1 = Y1,lgG2 = Y2 。计算t值的公式
为t = (Y1 - Y2 ) / sY −Y ,ν = n1 + n2 - 2。
1 2