标准差
(standarddeviation)样本内各变数变异程度的度量。由样本计算标准差的公式为:
S =
其中S为样本标准差,xi 为样本的的第i个观察值,x为样本平均数,
n
n为样本内观察数据的个数,∑(xi
i=1
- x) 2为离均差平方和,∑(读Sigma)
为求和符号。从上可知标准差是反映样本内各个变数与平均数差异大小的一个统计参数。从 S 可了解样本内各变数的变异程度及样本平均数代表性的可靠程度。S越大,说明各变数的变异程度越大,则x的代表性就越差,
反之亦然。此外,在生物统计中,还用样本标准差来估计总体标准差。在实践中通常用下式计算样本标准差 S。
S =
举例:调查某小组 18 名学生的身高(cm),其数据为:173,165,154,180, 175,170,166,162,158,169,160,174,179,177,
168,157,160,163。经计算得∑x=3010,∑x2=504408,
x = 167.2222,n = 18,代入上式得S = 7.9303。此外,标准差还可对变
数的次数分布作出估计,如观察数据属常态分布(正态分布),于是有:在
样本内,变数的个数约有68.26%落在平均数±1个标准差(即x±S)
的范围内;变数的个数约有 95.46%落在 x±2S 的范围内;变数的个数约有
99.74%落在x±3S的范围内。本例该小组约有68%的学生身高在
167.2222±7.9303(159.2919~175.1525)厘米的范围内;约有 95%的学生身高在 167.2222±2×7.9303(151.3616~183.0828)厘米的范围
内。一般考虑某调查数据的正常范围多取x±2S的范围。平均数和标准
差是分析数量性状最常用的两个参数。