检验的有效性和可靠性

检验的有效性是指对所要研究的变量能准确地加以度量；检验的可靠性是指在多次检验中，同样的结果能反复出现。而有的时候，检验的结果可能无效并且不可靠。更危险的情况却是结果表明出可靠性，但实际上却是无效的。例如，由于社会文化等方向的影响，一些研究人员设计出对妇女地位不公平的问卷，即使某项关于妇女的调查结果反复出现(表现出其可靠性)，但它却是无效的，因为从一开始它就有偏差，无法做到准确度量。

本章中所列举的检验方法，有助于我们分析数据并得出结论。这些检验都有量化的标准，如 t 值用于 t 一检验(t—test)，F 用于变化。一般数理统计书后都附有统计检验值表。用计算结果和检验值进行比较，可以得到有用的结论。例如，我们可能会得出结论说，所检验的某种关系非常强或者很显著，这个结果在某种程度上证实了我们的假设。

但是，检验的结果落在什么范围内才算是可靠的呢？换句专业术语说就是：误差界限或置信区间是什么？误差界限和置信区间通常用概率值来表示，有三种形式：

P≤0.01，表明某结果出现的可能性不少于 99％，其误差不超过 1％； P≤0.05，表明出现某结果的可能性不少于 95％，其误差不会 1 超过 5

％；

P≤0.1，表明出现某结果的可能性不少于 90％，其误差不会超过 10。选择哪种置信区间要视情况而定。例如，对探索性研究和关键性、决定

性的研究，可能选取不同的置信区间。如果实际一些的话，前者用 P≤0.05；后者用 P≤0.01。(如果我们想提高置信度、降低误差限，就必须抽取较大的样本，而这样做很可能会既不经济又费时间)。相反，如果你是一个挑剔的消费者，去小贩那里买东西，你所选择的置信区间，就要用 P≤0.01，而不是用 P≤0.05 了。因为前者更符合你挑剔的目的。