检验的有效性和可靠性

检验的有效性是指对所要研究的变量能准确地加以度量;检验的可靠性是指在多次检验中,同样的结果能反复出现。而有的时候,检验的结果可能无效并且不可靠。更危险的情况却是结果表明出可靠性,但实际上却是无效的。例如,由于社会文化等方向的影响,一些研究人员设计出对妇女地位不公平的问卷,即使某项关于妇女的调查结果反复出现(表现出其可靠性),但它却是无效的,因为从一开始它就有偏差,无法做到准确度量。

本章中所列举的检验方法,有助于我们分析数据并得出结论。这些检验都有量化的标准,如 t 值用于 t 一检验(t—test),F 用于变化。一般数理统计书后都附有统计检验值表。用计算结果和检验值进行比较,可以得到有用的结论。例如,我们可能会得出结论说,所检验的某种关系非常强或者很显著,这个结果在某种程度上证实了我们的假设。

但是,检验的结果落在什么范围内才算是可靠的呢?换句专业术语说就是:误差界限或置信区间是什么?误差界限和置信区间通常用概率值来表示,有三种形式:

P≤0.01,表明某结果出现的可能性不少于 99%,其误差不超过 1%; P≤0.05,表明出现某结果的可能性不少于 95%,其误差不会 1 超过 5

%;

P≤0.1,表明出现某结果的可能性不少于 90%,其误差不会超过 10。选择哪种置信区间要视情况而定。例如,对探索性研究和关键性、决定

性的研究,可能选取不同的置信区间。如果实际一些的话,前者用 P≤0.05; 后者用 P≤0.01。(如果我们想提高置信度、降低误差限,就必须抽取较大的样本,而这样做很可能会既不经济又费时间)。相反,如果你是一个挑剔的消费者,去小贩那里买东西,你所选择的置信区间,就要用 P≤0.01,而不是用 P≤0.05 了。因为前者更符合你挑剔的目的。