后悔值的计算

我们已经在正文中给百分之百悲观主义-后悔者下了定义。对于任何一列,他都确定出最高的报偿因素πkmax。在一格中与任何报偿π■相关联的后悔值ρij(i=A、B、C、D,j=Ⅰ、Ⅱ、Ⅲ、Ⅳ)为πjmax-πij,而按照定义, πjmax-πij≥0。由于我们可以计算盈利矩阵π的每个πij 的ρij,所以我们就可以建立一个相应的后悔值矩阵 R。

现在考虑预期后悔值这个概念。有几种计算预计后悔值的方法。一个方法是确定事态 j 出现的可能性 aj,j=Ⅰ,Ⅱ,Ⅲ,Ⅳ,在这里,0≤aj≤1, 而且∑a j = 1。所以,任何行动i(i = A,B,C,D)的后悔值为下述总数

j

∑aρij j

(9A.3)

另一个测定预期后悔值的方法是按大小排列后悔值如下: ρi(1)≤ρi(2)≤ρi(3)≤ρi(4)

此处括号中的下标仅涉及大小顺序而不涉及任何具体事态。设β(1) 为决策人所认定的任何一行的最小后悔值出现的可能,β( 2)为第二小后悔值出现的可能,β(3)为第三小后悔值出现的可能,β(4)为最大后悔值出现

4

的可能。于是,当0≤β (k) ≤1,而且∑β ( k)

k =1

= 1时,何任行动i的后悔值为

下述总数

∑β ( k ) ρi ( k) (9A.4)

k

现在考察谋求最小预期后悔值的人。百分之百悲观主义-后悔者用 9A.4 式来规定任何行动的预期后悔值。他设β(1),β(2),β(3)=0,以及β(4)

=1。于是,在选择使预期后悔值达到最小值的行动时,他会选择最大值中值最小的行动,即,他遵循最小-最大策略。(注意,完全保守型的后悔者也遵循最小-最大策略。然而,他不是按预期后悔值来看问题。反之,他只做那些“确有把握的”事,与任何行动相关联的确有把握的事是该行动所造成的最大的可能后悔值。因此,作为一个追求最小值的人,他选择这些确有把握事中产生最低后悔值的行动,每一行动仅有一个确有把握的事。)

百分之百的乐观主义—后悔者也用 9A.4 式来确定任何行动的预计后悔值。然而他却设β(1)=1;β(2),β(3),β(4)=0。这样,在选择使预期后悔值达到最小的行动时,他会选择最小值中值最小的行动,即,他遵循一条最小—最小策略。

现在来考察追求最小预期后悔值的人之中的那些认为每种事态都有可能实现,但由于缺少信息而认为每种事态发生的可能性大体相等的人。他用9A.3 式来确定任何行动的预期后悔值。他设 aⅠ,aⅡ,aⅢ,aⅣ=0.25,从而

得到每个行动 i 的值

0.25∑ρ ij I

他选择具有最低值的行动,而我们能够预料到这一选择。

然而,在通常情况下,当决策人用 9A.3 式规定预期后悔值,而我们不知道他所确定的 ai,或者当他用 9A.4 式确定的预期后悔值,如果我们不知道他所确定的β(k),那么我们就不能预测他的行为。