典型的变异规律及其度量
- 质量数据的类型质量数据是用来定量描述质量特性值的数据,任何质量管理活动都应实施定量化,否则就是不科学的。因此,企业的质量管理活动也可以说是一种以数据为基础的经营活动。质量数据按数轴上数的基本属性可以分为两大类,即计数值和计量值,其中计数值根据质量特性值本身的特点,又可以分为计件值和计点值。
计数值是数轴上的整数形式,例如在实际中统计产品的合格品及不合格品的件数,就用 0,1,2,⋯等整数记录。假如有一批量 N=100 件的产品批, 在未经检验之前,其中的不合格品件数是未知的。那么我们可以用 X 表示其中不合格品件数,则调的取值范围为 X={0,1,2⋯,100},X 在概率论中称为离散型随机变量,因为它的取值范围虽然明确,但取值具有随机性,只有在检验之后才能确定下来。如果我们检验的是铸件上的气孔数或布正上的疵点数,那么所统计的计点值也是离散型随机变量。
计量值表现为数轴上所有点的形式,是连续的和稠密的,根本没有空隙。例如只要测量的精度能够达到,而且也有必要进行精密测度,那么就可以将螺栓的长度测度到无限精确,其误差要多么小、就有多么小。如果把螺栓长度作为随机变量 X,那么 X 称为连续型随机变量。
如上所述,质量数据分类可以概括如下:
计件值
计数值 离散型随机变量
质量特性值 计点值
计量值 连续型随机变量
- 计数值的变异规律及度量
- 超几何分布(hypergeometric distribution)
超几何分布的研究对象是有限总体无放回抽样,即考虑样本抽取后对总体素质的影响。这里所说的总体可以是一批数量有限的产品(如 N=100 件), 在进行产品检验时,从中随机抽取样本(如 n=10 件)后,因为样本中可能含有不合格品,所以使总体批产品的内涵发生了变化,超几何分布是处理考虑这类影响的一类概率分布,其应用条件是有限总体无放回抽样。
超几何分布概率计算公式为:
Cd Cn−d
P(d) =
D N−D
n N
其中:N——产品批量
D——N 中的不合格品数N—D——N 中的合格品数n——从 N 中随机抽取的样本大小d——n 中的不合格品数n—d——n 中的合格品数
p(d)——在 n 中恰含有 d 件不合格品的概率
Cd ——不合格品的组合
n−d N −D
——合格品的组合
Cn ——从 N 中随机抽取 n 件的组合
例 1“将生产中的 12 个乒乓球放入一个盒中,如图 5.1.2 所示,其中有3 个不合格品。现从中随机抽取样本大小为 n=4 的样本进行检验,试求发现其中有一个不合格的概率。
解 由已知得N = 12, D = 3, n = 4,d = 1, 如图5.1.2所示。
Cd Cn−d
因为P(d) = D N−D
N
所以
C1 C3
P(d − 1) = 3 9 = 0.509
12
同理可以求出:
P(d = 0) = 0.255 P(d = 2) = 0.218 P(d = 3) = 0.018
设事件A为必然事件, 则根据概率的性质, 则有:
P(A) = P(d = 0) + P(d = 1) + P(d = 2) + P(d = 3) = 1,
验证:P(A) = 0.25 + 0.59 + 0.218 + 0.018 = 1,
当然,如果要知道样本中的不合格品数少于 2 个的可能性,即:
P(d ≤ 1) = P(d = 0) + P(d = 1)
= 0.255 + 0.509
= 0.764
如查要知道样本中的不合格品数多于是个的可能性,即:
P(d ≥ 2) = P(d = 2) + P(d = 3)
= 0.218 + 0.018
= 0.236
或概据概率的性质:
P(d ≥ 2) = 1 − P(d ≤ 1)
= 1 − 0.764
= 0.236
例 2 在产品验收检查中,将 20 个零件作为一批交验,如果从中随机抽
取 4 件进行检验,由于各交验批的产品质量不同,其超几何概率分布也不同,
假设连续交验的 4 批零件中所含不合格品数分别为 1 件,3 件,5 件和 7 件, 试通过计算和图形说明它们的概率分布形态。
解
(a)当N = 20, D = 1, n = 4时,
P(d ≤ 1) = P(d = 0) + P(d = 1)
C0C4 C1C3
= 1 19 + 1 19
4 4
20 20
= 0.8 + 0.2
= 1
(b)当N = 20, D = 3, n = 4时,
P(d ≤ 3) = P(d = 0) + P(d = 1) + P(d = 2)
+ P(d = 3)
C0 C4 C1C3 C2 C2 C3 C1
= 3 17 + 3 17 + 3 17 + 3 17
4 4
20 20
4 4
20 20
= 0.491 + 0.421 + 0.084 + 0.004
= 1
(c)当N = 20, D = 5, n = 4时,
P(d ≤ 4) = P(d = 0) + P(d = 1) + P(d = 2) + P(d = 3) + P(d = 4)
C0C4 C1C3 C2 C2 C3C3 C4 C0
= 5 15 + 5 15 + 5 15 + 5 15 + 5 15
4 4 4
20 20 20
4 4
20 20
= 0.282 + 0.469 + 0.217 + 0.031 + 0.001
= 1
(d)当N = 20, D = 7, n = 4时,
P(d ≤ 4) = P(d = 0) + P(d = 1) + P(d = 2) + P(d = 3) + P(d = 4)
C0 C4 C1 C3 C2 C2 C3C1 C4 C0
= 7 13 + 7 13 + 7 13 + 7 13 + 7 13
4 4
20 20
4 4 4
20 20 20
= 0.148 + 0.413 + 0.338 + 0.094 + 0.007
= 1
将上述计算的结果分别绘制成图 5.1.3 中的(a),(b),(c),(d) 四个概率分布图,使产品质量和样本中的不合格数以及概率分布的关系更加直观。
- 二项分布(binormial probability distribution)
二项分布的研究对象是总体无限有放回抽样,当研究的产品批量很大, 例如 N=1000 件或者 N→∞(实际中的一个连续的生产过程作为总体),在这种情况下,如果再用超几何分布去研究是十分困难或完全不可能的。然而, 用二项分布解决这类问题就变为现实。
根据概率论与数理统计推断的基本原理,当 N≥10n 时,可以用二项分布
逼近超几何分布,其误差在工程上是允许的,有概率统计原理证明超几何分布的极限形式是二项分布。
根据贝努利定理(Bernouli),二项分布的概率计算公式为:
P(d) = Cdρd (1 − ρ) n−d
其中:n——样本大小
d——n 中的不合格品数p——产品的不合格品率q——产品的合格率,即
二项分布规律主要用于具有计件值特征的质量特性值分布规律的研究。例如,在产品的检验和验收中,批产品合格与否的判断,以及在工序控制过程中所应用的不合格品率 p 控制图和不合格品数 pn 控制图的统计分析。
例 3 今有一批产品,批量很大,N=1000。产品不合格率 P=0.01,现从中随机抽取 n=10 件,试求经检验后发现有 1 件不合格品的概率有多大?至少有 2 件不合格品的概率有多大?
解 (a)P(d = 1) = Cdρd (1 − ρ) n−d
1 (0.01)1(1 − 0.01) 9
= 0.091
若考虑样本对总体的影响,则用超几何分布计算,即:
Cd Cn −1
Cd Cn−d
C1 C9
P(d = 1) = n N−D =
Nρ N−Nρ =
10 990
= 0,092
n n 10
N N 100
显然用超几何分布计算是最准确的,但计算比较麻烦,而且由已知条件可知,N≥10n 的条件满足,所以可以采用二项分布近似计算。
(b)P(d ≥ 2) = 1− P(d < 2)
= 1 − P(d = 0) − P(d = 1)
= 1− C0 (0.01) 0 (0.99)10 − C1 (0.01)1(0.99) 9
10 10
= 1− 0.904 − 0.091
= 0.005
例 4 有一交验批 N 很大,产品不合格率为 p,样本大小为 n,试绘图描述以下条件的二项分布规律,并加以分析。
n = 5 n = 5
- ρ =
0.10n
= 15
- )ρ =
- n
= 15
n = 30 n = 30
解(a)相同质量水平的交验批,当样本大小 n 增加时,二项分布逐渐趋于一种对称分布,即正态分布(有大数定律和中心极限定理证明)。如图 5.1.4
和图 5.1.5 所示(计算从略),以图 5.1.4 为显著。
ρ = 0.10
ρ = 0.10
ρ = 0.10
- n = 5
(b)n = 15
(c)n = 30
ρ = 0.05
ρ = 0.05 ρ = 0.05
(d)n = 5
(e)n = 15 ( f )n = 30
(b)相同的样本大小,不同质量水平的交验批,二项分布规律随不合格品率的增大而逐渐趋于一种对称分布,即正态分布(本节后面将加以介绍), 如图 5.1.4 和图 5.1.5 相比较所示。
ρ = 0.05 (f )n = 30
ρ = 0.10 (c)n = 30
在图 5.1.6 和图 5.1.7 所显示的两族折线图中,能够更清楚地看出上述
分析的趋势。同时,可以由图 5.1.6 中的 p=0.1,n=50,以及图 5.1.7 中的 p=0.25,n=25 得出以下结论:当 N≥10n,p≤0.1 或 np≥4—5 时,就可以用正态分布代替二项分布进行近似计算,实际上在一定的条件下,正态分布是二项分布的极限形式。
二项分布的平均值和标准差为: 平均值x = nρ
标准差σ =
其中:n——样本大小
p——总体的不合格品率q——总体的合格品率
- 泊松分布(Poisson distribution)
泊松分布研究的对象是具有计点值特征的质量特性值,例如布疋上出现疵点的规律、机床发生故障的规律。自然界和生活中也有大量现象服从泊松分布规律,例如每天超级市场的顾客人数,每分钟到达公共汽车站的乘客人数等等。
泊松分布的概率计算公式为:
λk e −λ
P(d = k) = k!
其中: λ = nρ
n—— 样 本 大 小 p——单位不合格率(缺陷率) e=2.718281
例 5 在产品的加工过程中,观察产品在装配中发生的缺陷,经 统计每台产品的平均装配缺陷数λ=0.5,试求在检验中发现恰有 1 个缺陷的概率有多大?
λk e −λ 0.51 e −0.5
解 P(d = k) =
k! =
1! = 0.303
上式可用计算器做计算或查附表A最为方便。查附表A得: P(d = 1) = P(d ≤ 1) − P(d = 0)
= 0.910 − 0.607
= 0.303
附表 A 中括号内的数为累积概率。泊松分布的平均值和标准差为: 平均值x = λ( nρ)
标准差σ =
例 6 利用例 3 中的条件,采用泊松分布计算。
解 λ = nρ = 10 × 0.01 = 0.1
λk e −λ
0.11 e− 0.1
查附表 A 得
P(d = k) =
k! = 1!
P(d=1)=0.0091
实际上,当 np<4 时,用二项分布和泊松分布计算可以得出几乎相同的结果,而用泊松分布计算显然更方便,可以查泊松分布表(附表 A)
有泊松定理证明。当 np≥5 时,正态分布是泊松分布的极限形式,如图
5.1.8 所示。
- 计量值的变化规律及度量1.正态分布的研究对象
在企业的生产和经营活动中,正态分布是应用最为广泛的一种概率分布。例如在机械加工的生产活动中,当质量特性值具有计量性质时,就应用正态分布去控制和研究质量变化的规律。包括公差标准的制定,生产误差的计算和分析,生产设备的调整,工序能力的分析。产品质量的控制和验收等。因此,了解正态分布的基本参数和生产过程状态的关系是十分必要的。
- 正态分布概率计算
正态分布的概率计算公式为:
F( X) = 1 ∫ x e−( x−μ) 2 /2 σ2 dx
其中:μ——总体平均值
σ——总体标准差
若随机变量 x 为什量质量特性值,并服从正态分布,则记作 X-N(μ,σ2)。当μ=0,σ=1 时,正态分布称为标准正态分布,记作 X—N(0,1)。用标准正态分布研究实际问题是十分方便的,可以借助标准正态分布表(附表 B) 计算分布概率。标准正态分布的概率密度曲线如图 5.1.9 所示,标准正态分布的概率计算公式为:
F( X) = ∫ x e−x2 / 2 dx
- 正态分布的平均值和标准差
正态分布的平均值μ描述了质量特性值 x 分布的集中位置,如图 5.1.10 所示。而正态分布的标准差描述了质量特性值 x 分布的分散程度,如图5.1.11 所示。μ和σ为正态分布的两个重要基本参数,只要μ和σ二者确定下来,那么服从正态分布的质量特性值 x 的分布曲线就唯一确定了,这在实际应用中是十分重要的。如图 5.1.10 所示,例如 x 表示某加工零件的长度尺寸,假设μ=0 的分布符合质量标准,也就是说,μ=0 的分布描述了一个生产过程的控制状态,那么μ=3 就显示了零件长度尺寸偏长的一个失控的生产状态。如果根据生产过程收集的数据统计分析的结果为这种状态,就必须分析原因, 采取措施,调整恢复到μ=0 的控制状态,否则会出现大量的不合格品。而μ=-2 的分布状态也是属于失控状态,此时描述的零件尺寸显然偏短。上述关于分布中心发生右的或左的偏移的状态,都属于生产过程的失控状态。可见,生产过程的失控状态是可以通过正态分布的平均值μ的变化显示出来。
如图 5.1.11 所示,假设通过三次生产状态的统计分析,μ没有发生变化
(μ=0),然而σ出现了三种不同的情况,和。如果是符合质量标准要求的, 那么,σ1=1.5,σ2=1 和σ3=1.5。如果σ2 是符合质量要求的,那么σ=1.5的生产状态说明零件长度尺寸有更大的分散性。如果与公差界限比较,一定会出现超出上公差和下公差的不合格品,这也是一个失控状态,是不允许的。而σ0=0.5 的情况说明零件尺寸长度分布更集中了,也就是加工的精度提高了。分析其原因,也许是采用了新技术、新工艺或新设备。可见σ的变化也描述了生产过程的状态。因此,不难想到在实际中,如果质量特性值是服从或近似服从正态分布规律,那么可以通过μ和σ的变化控制生产过程状态, 这就是工序质量控制的基本原理。
④“3σ原则”
根据标准正态分布规律可以计算以下概率:
φ(x) = P(μ − σ < x < μ + σ)
= P[−σ < ( x − μ) < σ]
= P(−1 < x − μ < 1)
σ
= φ(1) − φ(−1)
查附表B得
φ(x) = φ(1) − φ(−1)
= 0.8413 − 0.1587
= 0.6826
同理, P(μ − 2σ < x < μ + 2σ) = φ(2) − φ(−2) = 0.9546 P(μ − 3σ < x < μ + 3σ) = φ(3) − φ(−3) = 0.9973
将上述三个计算结果用图 5.1.12 描述,并得出以下重要结论:若质量特性值
服从正态分布,那么,在±3σ范围内包含了 0.9973 的质量特性值,这就是所谓“3σ”原则。因此可以断言,在±3σ范围内几乎 100%地描述了质量特性值的总体分布规律。所以,在实际问题的研究中,已知研究的对象其总体服从(或近似服从)正态分布,就不必从-∞到+∞的范围去分析,只着重分析±3σ范围就可以了,因为±3σ范围几乎 100%地代表了总体。应该指出“3σ原则与σ无关,无论σ值大些,还是相对小些,在“3σ”范围内都包含了 0.9973 的质量特性值,如图 5.1.13 所示,阴影部分面积为 0.9973。
- 正态分布的概率计算
例 7 某儿童食品包装的重量平均值为 296 克,标准差为 25 克,假设该产
品的重量服从正态分布,已知重量规格下限为 273 克,求低于规格下限的不合格品率为多少?
解 已知μ = x = 296,
σ = 25, xL
= 273
设标准正态变量为u,
则 u = x L − x
σ
φ(u) = φ( xL − x)
σ
= φ( 273 − 296)
25
φ(−0.92)
查附表 B 得:
8 (−0.92) = 0.1788
如图 5.1.14 所示,该生产加工工序低于下限的不合格率为 0.1788。 假设x = 296 克是产品重量标准的公差中心,那么要减少不合格品率,提
高产品质量,就是要提高包装的重量精度。也就是要采取有效措施减小σ, 使包装的重量更加集中,从而降低不合格品率,保护消费者的利益,提高企业的信誉。
假设 x = 296 克相对公差中心向左偏移,则需要采取措施使分布中心
x(μ) 向右调整,则低于的不合格率会下降。
例 8 已知 273 克,σ=25,对例 7 的产品不合格率规定不得超过 0.01,试求x 应控制的中心位置。
解 已知 xL=273,σ=25,允许不合格率 P=0.01,根据正态分布的性质,
超出质量标准上、下界限的不合格品率各为 0.005,故:
8 (u) = 0.005
查附表 B 得:
u = −2.58
而 u = xL − x
σ
而 x = x L − uσ
= 273 − (−2.58) × 25
= 337.5
因此,公差中心应定在 337.5 克,生产过程中将分布中心控制在 337.5
克,才能保证不合格品率不超过 0.01。调整后的生产过程状态如图 5.1.15 所示。
应当指出的是例 B 的情况只是一种假设,显然这种情况下公差 T 相对x
太大了。原因是因为T/2= x -xL
=337.5-273
=64.5
所以,T=129。这意味着单件产品顾客和生产者都可能要承受最高可达 64.5 克的损失。
例 9(利用例 7 和例 8 的分析结果)假设x =296 克为标准包装重量,即为公差中心 M,允许不合格率为 0.01,xL=273 克,那么唯一的途径是提高包装的精度,即减小σ,试根据以上条件计算σ值。
解 φ(u) = 0.005
查附表B得:
u = −2.58
xL − x
因为 u =
所以 σ =
σ
xL − x u
= 273 − 296
− 2.58
= 8.91
提高包装精度以后的产品重量分布状态如图 5.1.16 所示。应该指出,在实际生产中对分布中心μ(x) 的调整相对于对σ的调整容易得多。要将σ由 25 克调整到 8.91 克,也许要投入比较多的资金,对生产工艺和设备做比较大的改进,是否采用上述方案需要做可行性分析才能最后决定。
例 10 在例 7 的条件下,试求包装重量高于 346 克的概率。
解如图 5.1.17 所示,根据概率分布的基本定义得:
1 − φ(u) = 1 − φ( xi − x)
σ
= 1− φ( 346 − 296)
25
= 1− φ(2)
查附表B得:
φ(2) = 0.9773
所以 1 − φ(2) = 1 − 0.9773
= 0.0227
因此,有 2.27%的产品包装重量多于 346 克。
例 11 某地区民用电压检测得到平均电压 228.5V,标准差为 1.25V,求供电电压介于 226V 和 230V 之间的概率(见图 5.1.18)。
解 根据概率分布的基本定义和性质有: F( x) = φ(u1 ) − φ(u 2 )
= φ( x1 − x) − φ( x 2 − x )
σ σ
= φ( 230 − 228.5) − φ( 226 − 228.5)
1.25
= φ(1.2) − φ(−2)
1.25
查附表 B 得:
F( x) = φ(1.2) − φ(−2)
= 0.8849 − 0.0183 所以,有 86.66%的电压值介于 226V 到 230V 之间。
= 0.8666
例 12 假设有,15%的用户电压低于 225V,标准差为 1.25V,预测此时用户的平均电压力多少?
解 已知φ(u) = 0.15,
查附表B得:
u = −1.04
而φ( u) = φ( xi − x)
σ
u = xi − x
σ
经整理得:
x = xi − uσ
= 225 − (−1.04) × 1.25
= 226.3
所以,控制平均供电电压为 226.3V,那么其中有 15%的用户电压低于225V,如图 5.1.19 所示。
- 小结
对上述关于计量值和计数值分布规律的讨论做以下概要归纳:(近似计算的条件)
二项分布
N ≥ 10n,ρ ≤ 0.1
或nρ ≥ 4~5
→ 正态分布
泊松分布 nρ ≥ 5 → 正态分布
可见,用正态分布研究质量变异的规律是十分方便的,所以正态分布在质量管理中有着特别重要的理论价值和实际价值。