NPV=0

内部收益率可用来评估并排出项目的优先级,但却未考虑项目的资金占用量。于是,就会造成投资规模虽然小,但因为回报相当高,因而排在了投资规模大收益也不错的项目之前。如果通用电器公司斥十亿美元的资金于科研,投资大项目上的资金占用也就很大,但项目的内部收益率却可能较低。

用内部收益率方法排列项目优先级顺序,还忽略了用于净现值分析中的障碍率贴现系数。障碍率,正如我前面已介绍过的那样,是对风险的修正。如果其它条件相同,Quarker 公司投资购买设备这一项目的内部收益率可能要比 Merck 公司投资瑞士高风险的癌症研究项目低,但 Quarker 公司项目的净现值却可能较高。Quarker 公司的项目因风险较低以及相对小的现金流量,选择 10%的贴现率贴现是合适的,因而 NPV 值也较高。癌症研究项目风险太高,所以用 50%的贴现率分析。请注意:选用的贴现率越高,未来现金的现值就越低,同时意味着项目的风险也越高。

概率论

概率论(Probability Theory)是统计学的委婉语,因为统计学是一门连商学院里最聪明的注册会计师(CPAs)也胆怯的课程。实际上,概率论一词能更准确地描述如何统计学来解决问题。在考虑石油钻井出油的概率时,Sam 应采取什么方案?在美国前十所商学院 800 名已婚的 MBA 学生中,有多少人会在学习的头一年里疏远其配偶?这些都涉及概论率的概念。由于许多商人惧怕统计,于是 MBA 们就有了发挥才能的机会。MBA 课程强调统计的实用性。如果你对统计不熟,请不要跳过本节。我虽然无从只用几页纸就让你变成个统计通, 但我敢保证,只要你耐心读下去,就可以掌握今后工作中遇到实际问题时所应具备的基本分析技能,也知道应于何时求助于别人。MBA 课程最重视传授各门课程解决具体问题的实际经验。

概率分布

在事物可能出多种结果的情况下,就会有结果的分布。每种可能都有一种概率。通过认真的分析,有时也凭直觉和判断,事件(Event)可能结果的概率之和是 100%,这和决策树中的情形一样。表示分布结果的图形叫做概率群或密度分布函数(Probability density function)。如果可能出现的结果较少,曲线就不匀称,称为概率群分布函数(Probability mass function).

降雨量概率群分布函数

西雅图每日降雨 1992 年 4 月(31 天)

降雨分布举例

西雅图降雨量的分布就是一种概率分布。我们把假设收集到的数据列表如下,其分布图附后。

西雅图每日降雨量数据表

(1992 年 4 月)

降雨量概率密度分布函数西雅图每日降雨量1962—1992(1240 天)

二项式分布

抛掷硬币得到的概率有一正一反两种可能。如果把得到两个“正面”结果算作成功,那么,抛掷两个硬币的结果分布就有以下几种可能。

两个都成功 正面/正面

一个成功/一个失败 正面/反面;反面/正面

两个均失败 反面/反面

抛掷硬币的结果是分布的最基本情况,称为二项式分布

(Binomial distribution)。二项式分布的结果有两种:成功和失败。二者发生的机会相等。

貌似神秘的二项式理论也可用来分析股票市场的实际问题。在分析股票时,某月内股票的回报如果为正,则称其为成功;为负或持平时就称其为失败。对 1957 年至 1977 年美

国 AT&T 公司股票价格的研究表明,对每月都进行分析以确定成功出现的频率,人们发现 56.7%的情况下,结果是成功的。将分析的数据按每三个月(季度)一组列出,研究人员

发现实际成功的频率如下:

#成功次数

发生频率

0

0.088

1

0.325

2

0.387

3

0.200

1.000

数学家把抛硬币的结果列表用以解决所有的二项式分布问题。在 AT&T 的例子中,利用二项式表格之前需要了解的数据是:

r=成功可能次数=0 到 3

n=试验次数=3(一季度内 3 个月) P=成功概率=56.7%

利用这些数据,从二项式表中得出的期望结果应是:

#成功

期望频率

0

0.082

1

0.318

2

0.416

3

0.184

1.000

令人惊奇的是,二项式的分布和 AT&T 的实际情况相当接近。在已知假设的成功概率(p)后,每一季度内赚钱月份的情况就可以从二项式表中得到。因此,二项式分布对负责投资组合的基金管理者、公司负责销售的董事和研究人员分析项目概率、确有实用价值。

正态分布:钟型曲线之迷

正态分布(Normal distribution) 是应用最普遍的

理论,通常称为钟型曲线(Bell curve)。哈佛大学用钟型曲线确定学生考试成绩。曲线表明 15%的学生考试刚刚擦边及格。达顿商学院的教授们凭借自己的判断给出不太满意的 C(极格)和 F(不及格)。结果两所学校校园的竞争风气截然不同。

不同标准偏差曲线的概率密度分布函数

当概率群分布函数是基于多次试验基础之上时,曲线就趋向于类似钟型的形状,我们称之为概率密度分布函数。描述西雅图降雨分布的两张图即是这种情况。中间的凸起部分是由于“中间集中理论”(Central Limit Theorem)作用引起的。它说明“独立事件重复发生的概率的平均分布呈一种钟型形状的正态分布”。为什么?简单说,就是因为大量独立事件的趋势是向中间平均值临近。

“平均事件”这一概念相当含糊。在用应用举例中其定义延伸到可包括任何一大组的数据。为什么?因为正态分布易于使用,且和实际生活中的情况又极其相似。市场变化不定造成股票价格浮动,最终导致或盈或亏的回报结果。回报可以被认为是市场变化的“平均”值。正如任何事情都可以用具有平均性来解释一样,正态分布的实用性亦如此。

正态曲线的测量

钟型曲线可用两个名词来描述,即中项(Mean)和标准偏差(Standard deviation, SD)。中项(μ)是曲线的中心部分, 通常称这个中项为平均值。平均值是用数据加在一起之总和除以数据点。标准偏差(σ)是衡量偏离平均值的宽窄程度。在概率概念中,这两个名词是非常重要的。

其中用的较少的衡量一组数据平均值的方法还有“中值” (Median),即按数字大小排列后的中间项数值,和“众数值” (Mode), 即一组数据中出现频率最高的数。

和二项式分布一样,曲线下代表所有出现结果的可能之和为 100%。正态分布曲线特别的地方在于,对于任何已知的偏离中项、中心的标准偏差,尽管正态分布的形状不同,但事件的概率相同。

零售业正态分布举例

鞋店老板 Al Bundy 先生想要知道店里的库存能否满足顾

客对不同尺寸鞋子的需求。他从鞋业研究中心买了一份女鞋尺寸调研报告,并通过问卷调查收回了大量数据。

他将收集到的数据画在坐标图上,得到的形状像是一正态分布。另外,他将鞋的不同尺寸也输入计算器,得到标准偏差数值是“2”。他还分析了所收到的问卷中的鞋子尺寸平均值,得到的号码是“7”。再看亲手绘制的图表,确实是个令人可信的正态分布。

对正态分布图,Al Bundy 先生可以用上分析正态分布曲线的原理。此原理适用于所有正态分布曲线线下区域:

ISD=0.3413 2SD=0.4772

3SD=0.49865

4SD=0.4999683

依据这一原理,若 Bundy 先生库存鞋的号码在 5—9 之间, 就包括了人群穿鞋号码的 68.26%(2×

鞋子尺寸正态分布

0.3413)。库存的号码如果在 3—11 之间,就包括了 95.44%。如果库存的鞋从 1—13 号都有,那么,光顾他商店的 99.73%

顾客就都会满意。对那些低于 1 或高于 13 的特号鞋,他总是可以随时从别处定得到的。

当然,学有用于确定曲线上任一特殊点处的概率(中项以外的非整数标准偏差)正态分布表。用此表之前,必须先算出(Z value),即:

正态分布曲线财务举例

让我们把刚学到的概率论的原理应用到金融上。以每月回报率波动的先锋航空公司(Pioneer Aviation)股票为例, 假设成正态分布形状。对该股票以往的回报统计表明,平均值为 1%,标准偏差为 11%。Gerald Rasmussen 先生想知道下个月股票的回报率低于 13%概率是多少。

Z = (13 - 1) = 1.09(离平均值的标准偏差) 11

概率密度分布函数

先锋航空公司每月股票回报率

平均值

每月股票回报率

用新计算出的 Z 值概念可以计算出:

从附录中的提供的正态分布表可以查到:1.09 标准偏差

=0.3621。和所有正态分布图一样,图中左半部分的概率是50%。在所有的正态分布中,超过或低于中项的概率是 50%。根据这些条件,我计算出,该股票回报率低于 13%的概率是86.21%(即,36.21%+50%),超过 13%的概率是 13.79%(即,

1-86.21%)。这就是用概率理论解决金融上实际问题的具体例子。

如果不太过分强调理论,概率统计实际并不难。此外, 还有一些其它类型的分布,但商业上用的较少。泊松分布

(Poisson Distribution),和正态分布类似,但图形右侧尾部展开。但多数分布都被假设是正态分布,以利用正态分布标准偏差的原理分析问题。

累计分布函数

累 计 分 布 函 数 ( Cumulative distribution function,CDF)是对概率分布的累计观察。它分析诸如钟型曲线等概率集合分布函数,了解“结果出现小于或等于该值时的概率是多少?”从普通的正态分布曲线,能知道某一已知结果出现的概率是多少,而累计分布函数能告诉我们一组已知的价值范围内出现的概率有多大。累计分布函数还可以用来把我们掌握的概率理论和决策工具(决策树)结合起来。累计分布函数研究在许多数量价值不确定下所可能出现的结果的范围。

仍以前文提出的钻井项目为例,分析一下如果地下有油,

其油量价值分布的情况。

油量价值

概率集合分布函数

累计分布函数

累计概率小于或等于

50000

0.005

0.005

75000

0.01

0.015 ( 0.005+0.01 )

150,000

0.03

0.045 ( 0.03+0.01+0.005 )

200,000

0.08

0.125

300,000

0.12

0.245

750,000

0.15

0.395

1,100,000

0.21

0.605

1,200,000

0.15

0.755

1,400,000

0.12

0.875

1,700,00

0.08

0.955

2,000,000

0.03

0.985

2,500,000

0.01

0.995

6,000,000

0.005

1.00

1.00

概率密度分布函数

先锋航空公司每月股票回报率

平均值

每月股票回报率

在前文的树型图举例中,我们曾假设该项目的收益是1,000,000 美元。为方便起见,我们取该值为采到油的期望值

(EMV)。实际上该项目出油的结果分布范围较广。从表中可以看出,出现收益为 6,000,000 美元的概率是 0.5%,出现收益为 50,000 美元的概率也是 0.5%。如果用发生每一概率的金额乘以其第二列中对应的概率,得出的期望值就等于我们前面用到过的期望值 1,000,000 美元。

当决策者不知从何开始着手分析时,用建立累计分布函数的方法便可使他们得出平均值或期望值。画累计分布函数是一种有效方法,可将一系列你对未知事件可能出现的高、中低结果概率的判断结合起来,以得到供决策用的期望值。

一组可能结果的累计密度分布函数图就像一个大的“S”。在累计密度分布函数中,你一眼就可以看出所有可能的结果,

而不仅仅是统计中的几个独立的点。如下图所示, Sam Houston 先生认为,出现的结果可能在 0 到 6,000,000 美元的连续区域内。

累计分布函数中的从 0 到 1.0 的概率区域可用中值方法

(Bracket median technique)将之分成“区间”。上图中的累计分布函数就是用这种方法分为 5 个区间的。例如,你可将之分成 0.1,0.3,0.5,0.7,0.9 的区间。每个区间分别代表的便是 0 到 0.2,0.2 到 0.4,0.4 到 0.6,0.6 到 0.8 以及 0.8 到 1.0 的“价值区域”的平均值。

概率是 0.5 的区间即是中数,这是因为左右两边各代表价值的一兰。但这个中数并不一定非是前面正态分布中提到的平均值。中值仅仅是价值区域的中心,而平均值则是用价值和发生的对应概率相乘后得到的积,例如在前面采油的举例中,我们用平均值的方法计算出出油的期望值是 1,000,000 美元。

累计密度分布函数

出油可能结果价值(单位:千美元)

油的价值

为把累计密度分布函数应用到决策树中,以便用出重要的管理决策,请你考虑一下如何将油井可能产生的价值全部表示出来。其概率结果应成一“扇形”,代表着“一组”价值。你也许不可能在树上画出无限根分枝来,所以,让我们借助于累计密度分布函数的方法来解决问题。

画出累计密度分布函数

要画出如上的累计密度分布函数图,你不仅要使用自己的研究数据,还要独立进行分析判断。你要对自己提出如下的一系列问题:

发生的概率或高于或低于 50%(中值)时的价值是多少? 发生的概率在较低的区域(10%区间)的价值是多少? 发生的概率在较高的区域(90%区间)的价值是多少?

钻井决策树

使用累计分布函数

EMV=.9[(.2×130 美元)+(.2×750 美元)+(.2×870

美元)+(.2×1150 美元)+(.2×2100 美元)]

根据上述问题的答案,你就可以将自己认为的全部结果画成累计分布函数图。从累计分布函数中的 5 个区间内,挑

选出 5 个结果,你就可以在决策树上画出树枝似的 5 种可能结果的扇形概率(Even fan)。

此处的期望财务值和前面第一次提到时的数值是一样的。我第一次选此值的原因,完全是为了方便读者。

利用 5 个区间的另一种简洁方法叫“皮尔逊·图基法”

(Pearson Tukey Method)。这种方法不用 5 个区间,而是用 3 个区间,即 5%,50%和 95%三种,而其各自对应的概率分别是 18.5%,63%和 18.5%。

在分析重大问题时,人们用蒙特卡罗(Monte Carlo)模拟程序计算决策树。计算机的计算横型中包括了概率扇形的累计分布函数以及有关树型图中的有关参数。该程序可对多种情况进行模拟,让你了解事件发生时的情景。“Fortune” 杂志评选的前 500 家公司,不少公司就使用这种方法。

当决策树中的某一分枝的期望值不确定时,便可使用累计分布函数和区间分析法。但是,分析人员自己的判断还是最重要的。决策树仅仅是 MBA 们基于知识和凭借直觉分析问题的一种工具而已。

回归分析和预测

线性回归(Linear Regression)模型是分析人员用以凭借直觉确定多种商业情况下有关变量之间关系的工具。一旦找到了这种关系,就可以用它来预测将来。普通的线性回归是用于分析销售额和价格、促销和市场等诸多因素之间的关系,股票价格和盈利、利息之间的关系以及生产成本和产量之间的关系。当然,也可以用它来得到诸如“天气温度的变化对销售冰淇淋的影响如何?”这一问题的答安。此例中, 自变量(Independent variable)X 表示温度,是引起其它数值变化的变量。因变量(Dependent variable)Y 是销售额。是温度影响销售,而不是相反。

回归分析要求收集足够的数据,以确定变量之间的关系。

通过相当多的数据点,诸如一年里有关温度的数据及销售的变化情况,我们便可以温度为 X 轴,销售额为 Y 轴画出图形来。研究回归的目的是要找到一条能够最准确地描述二者之间关系的线性等式。回归就是在画出的数据点中间“插入” 一条直线,并尽量使“各点距这条线距离差的平方最小”。

这种“最小平方法”(Least squares method)要求做大量数据的加、减和相乘。在具体计算上,使用计算器或 Lotus1- 2-3 软件即可。

线性代数复习

在学习回归的具体例子之前,先让我们复习一下线性代数的一些基本概念。代表直线的线性方程是:

Y=mX+b

其中,Y=因变量(如销售)

m=直线的斜率(变量之间的关系) X=自变量(如雨量)

b=y 轴上的截距(直线与竖轴的交叉点)

Lotus1-2-3 计算软件可以求出决定自变量和因变量之间关系的线性方程。Lotus 软件还能确定这条计算出的“最佳” 的直线能否作为工具准确地预测将来。

冰激凌的回归举例

Ben&Jerry 先生是 20 多家冰淇淋连锁店的老板。他注意到随着温度的升高或降低,公司的销售额也有相应的变化。为了确定季节性气候变化和销售额之间准确的数学关系,他收集了前 5 年每月的销售数据,又从国家气象服务中心查到对应月份的平均温度。他收集的数据如下:

10

73 600,000

11

45 300,000

12

36 500,000

用 Lotus 计算软件中的数据回归(Data Regression)功能计算,店主得出如下结果:

回归结果

常娄

-379,066

估计的 Y 值的标准偏差

243,334

R 平方

0.704

X 系数

16,431

系数的标准偏差

3,367

上列数据的含义是什么?

上面列出的内容包含了描述 Ben&Jerry 公司销售和温度变化之间关系直线方程的数据。先列出线性方程式:

常数=b=-379,066 X 系数=m=16,431

将之代入前面的标准线性方程式中,即: Y=16,431X-379,066

将数据点在图中画出,并根据方程式绘出这条回归线。用 Lotus 计算软件画出的图形如下:

销售 Ben&Jerry 冰淇淋回归举例温度°F

如图所示,回归直线从数据点的中间穿过。将温度值 X 代入等式中,就可以计算出预计的冰淇淋销售量。在 Ben&Jerry 的例子中,当温度为 60F°时,估计的月销售额应为 606,794 美元,即

Y=(16431×60F°)-379,066=606,794 美元

用这种公式计算出的预计的冰淇淋销售额准确度如何? 对这一问题的答案,可从 Lotus 计算软件中的回归结果

(Regression Output)计算出的另一个数字中找到。

R 平方释义

R 平方值告诉我们“用已知的回归方程式解释了数据变化的百分数”。在这一举例中,回归方程式解释了销售变动的70.4%。这一比率是很高的。在更为广泛的经济分析中,由于对经济起影响作用的变动因素很多,所以,能达到 30%的 R 平方值就算是很高的了。在冰淇淋行业,除了天气的变化,所做的广告,分发的优惠券以及商店营业的时间,都会对销售

额的变化有影响。

但是要当心!不要过分指望回归数据的结果!关于温度变化引起的销售的变化,回归能告诉你的也就这么多。回归并没说“温度变化确实引起了销售的变支”。但如果选择的自变量合理,就能得出你想要了解的因变量的值,还是用之为好。

回归分析不仅能指出诸因素的正面关系,如气温和冰淇淋的销售的关系,还可以解释负相关因素之间的关系,如利息和房屋销售的关系。如果利率高,房屋的销售就慢。在这种情况下,X 系数是负数。这些负相关的作用一如正相关的作用,都是很有用的。

标准误差释义

Lotus 计算软件得出的“Y 的标准误差和 X 系数”是回归线 Y 值标准偏差和 X 系数之标准偏差的同义词。在 Ben&Jerry 举例中,估计的 Y 值(销售)标准误差在 68%的情况下是要加、减 243,334 美元。同样得出的结果表明,X 系数(温度)标准误差是 3367。用标准偏差的方法可以对可能的一组数据进行各种分析,以确定这些数字的变化以及得出的回归方程式的可靠性。

可靠性的 T 型统计测量方法

T 型统计(T Statistic)有助于确定用 Lotus 软件计算出的回归方程是否能很好地进行预测。T 型统计揭示的是 X 变量对 Y 函数是否在统计上有重大的影响,例如气温对销售的影响。这一计算方法是将相关系数 X 除以标准误差。大拇指定律是:如果 T 统计高于 2 或低于-2,变量 X 对函数 Y 就有统计得到的影响。在我们的举例中。16,431÷3,367=4.88, 具有相当高的 T 型统计值。所以,分析人员就会得出气温对销售的影响非常明显的结论。

在考虑某一模型能否作为好的预测标准时,需要有一个

较高的 R 平方值和一个较高的 T 型统计值。还可以做出不只一个 X 变量的模型,叫多重变量回归( Multivariable regression)。随着变量数量的增加,R 平方也随之增高。但是,多增加 T 型统计低的变量 X 会造成模型不准确。因此, 有必要人为地增加或减掉独立变量,以达到较高的 R 平方值

和较高的 T 型统计值。

虚拟变量回归分析

回归分析中使用的一种技巧,就是通过虚拟变量(Dummy variables)表示那些无法用数字衡量的假设条件,即用 0 和1 来表示。例如,在 Toys“R”Us 公司,某一季节内热销的环具有库存,这就是一种能保证销量急剧上升的非数学化的条件。采用虚拟变量的方法,我们把有库存的用“1”表示,无库存的用“0”表示。

假设 Toys“R”Us 公司的一家商店有一组数据,你便可以看出这组数据是如此发挥作用的。

日期

热销玩具库存情况

销售(美元)

( 1=有库存, 0=无库存)

92/12/1

0

100,000

92/12/2

0

100,000

92/12/3

1

200,000

92/12/4

1

200,000

92/12/5

0

100,000

92/12/6

1

200,000

92/12/7

0

200,000

用 Lotus 软件计算出的热销玩具和销售之间的关系的回归结果是:

回归结果

常数 100,000

Y 估计值标准误差 0.001

R 平方 1.00

X 相关系数 100,000

相关系数标准误差 0.0009

这是一个条件非常完美的例子。因为 R 平方解释的变化量是 100% ,T 型统计值也非常合适。T 型统计接近无穷

(100,000/0.0009)。无热销玩具时的销售额是 100,000 美

元,有这种热销玩具时的销售量能再多增加 100,000 美元。用 Lotus 计算软件计算,这一回归方程式就是:

销售=100,000X 美元+100,000 美元

如果人人想买的这种玩具,公司有货,则 X=1,销售额增至 200,000 美元;如果无货,则 X=0,总销售额是 100,000 美元。虚拟变量非常有用,可把无级数据,如库存状态、节假日等,和其它有规则的有级变量,如温度、利率、残次品等, 结合在一起考虑,做出有用的回归模型。

其它预测方法

时间序列法(Time series techniques)是依据一段时间内关系的变化预测结果。在冰淇淋例子中,绘画出的气温和销售的数据点并未考虑它们各自发生的时间。回归关系分析并不考虑时间。显然,季节对 Ben&Jerry's 的销售有影响。时间序列法在绘出数据点时考虑了发生的时间。这种方法试图将数据内的变动分离成 3 个部分:

强调趋势——上、下、平稳(长期衡量)

周期——小时、每日、每周、每月(短期衡量)

意外变动——由于特殊情况或自然巧合引发的意外或不规则变动

回归和变动平均是用来确定事物发展的趋势和周期的。你可以想象得到,时间序列的预测过程非常烦琐,用简单的例子也不了什么问题。但知道有时间序列这种方法,对你至少还是有帮助的。

总结

本节介绍了具有下列功能的数量分析方法: