三、遥感数字图像的分类处理
自然界中不同类型的地物具有各自不同的电磁波谱特性,遥感数字图像中像元的不同数值(亮度值)反映了相应地物的波谱特性。因此,通过计算机对图像像元的数值的统计、运算、对比和归纳,对像元进行分类,即可达到对地物的自动识别。这种技术处理称为遥感数字图像分类处理,或称计算机自动识别。
图像的分类在数学或计算机处理上可归结为对一模式或数组的分类和识别,或是以适当的判别函数加以判别分类。模式的取得或判别函数的确定有二个基本途径,一种是通过对已知类别的样本统计运算得到分类参数、条件, 确定和取得判别函数和模式;另一种则是在缺少已知条件的情况下,通过对输入像元数值自身规律性的统计运算,总结、归纳出所需参数和条件,获得判别函数或模式,进而进行分类。前者称为监督分类,后者称为非监督分类。
(一)监督分类
监督分类又称训练场地法或先学习后分类法。它是先选择具有代表性的典型试验区或训练区,用训练区中已知地面各类地物样本的光谱特征来“训练”计算机,获得识别各类地物的判别模式或判别函数,并依此模式或判别函数,对未知地区的像元进行处理分类,分别归入到已知的类别中,达到自动分类识别的目的。
监督分类的流程框图如图 7-16 所示。具体方法是:
-
选择有代表性的典型训练场地,或在遥感图像上圈出已知地物分布的范围界线。例如:现有已知地物 M1、M2、M3。
-
对已知训练区的已知地物样本的光谱特征或已知地物所有像元各波段的数值(亮度值)进行统计,提取各地物类别的数值特征。例如:各类型地物不同波段的均值、标准差(或称方差)等,若用三个波段表示,则有如下形式:
M11,S11
M1 M12 ,S12
M13 ,S13
M21,S21
M2 M22 ,S22
M23,S23
M 31,S31
M3 M 32 ,S32
M 33,S33
( ik 为各类别的均值,Sik 表示各类的标准差;其下标 i=1,2,3,⋯, 表示类型,k 表示波段,k=1,2,3,⋯。)
-
确定分类判别函数,即选择和确定分类的方法,以使计算机能按确定的程序进行分类。分类的方法很多,例如:最小距离法、相似判别法等,可根据具体情况选择。
-
分类参数、阈值的确定。由于像元数值的随机性,各类地物像元数值的分布都是围绕一个中心特征值,散布在空间的一定范围内。为此,在分类判别前必须确定出各类地物的中心特征值(参数)及其分布范围界线——类型阈值大小。例如:可将地物各波段均值所在的空间位置作为类型的中心特征值;相应波段的标准差(即 t·Sik)作为类别的阈值,限定类型的分布范围。这样就构成了一个“分类器”。
-
分类。利用“分类器”进行分类,即根据选定的分类方法,以及确定
的分类参数和阈值进行分类。例如:将输入的像元数值与各类型的中心特征值比较,并按所确定的阈值,把像元归入到最相近的类别空间里,并赋于新值,完成像元分类。
-
检验。是指对“分类器”分类精度的检验。即统计“分类器对已知样本像元的分类精度(已知样本像元错分率)。若不合格,则返回 4 或 3 中, 重新调整各类阈值(tSik)或重新确定分类参数,直到“分类器”分类精度达到要求为止。这样,经已知样本反复“训练”所构成的“分类器”即认为调整好。
-
输入未知像元。利用已调整好的“分类器”分类,将未知像元归入到各类别中,输出分类图像。
获得的分类图像要拿到实地或对照地面已知资料进行检验,检查和评价分类的精度和效果,总结经验,不断提高分类处理的质量和水平。
监督分类简单实用,但在处理分类前必须确定好已知地物样本的分类特征及其参数。这是分类成败的关键。已知样本分类特征及其参数的确定要有代表性,要有足够的样本(或像元)作为统计的基础。此外,由于环境的变化及其复杂性,以及干扰因素的多样性和随机性,由训练场地已知样本所获得的分类特征及其参数,只能代表一定时间和具体地域的情况,不能无条件地推广。若地区情况或环境条件变化,应该另选训练场地,以免造成较大的误差或误判。
(二)非监督分类
非监督分类又称边学习边分类法。它直接对输入的数字图像像无数值(亮度值)进行统计运算处理,分别将每个像元归纳到由图像各波段构成的多维空间中的集群中,达到分类识别的目的。例如,一幅陆地卫星 TM 图像有六个波段(不包括 TM6 波段),图像中的每个像元即由这六个波段(TM1,3,4,5,
7,)构成的六维空间中有一确定的点与之对应。由于同一类型的地物有着相
近似的光谱特性,这样相同性质的像元点就汇集在空间中的一定范围的区域内,形成点的集群。不同类型的地物,则在空间中的不同地域形成集群。如图 7-17,是由 TM2、TM3 和 TM4 三个波段构成的三维空间,A、B、C 分别为三种不同类型的地物汇集的集群。显然,可以通过采用数理统计或其它数学处理方法,将各集群的空间分布状态、范围界线等参数定量地确定,归纳成一定的数学模式或判别函数,用来区分和识别每一像元的属性,自动地进行分类处理。
非监督分类的方法很多,图 7-18 是非监督分类的流程框图,从框图中不难看出:非监督分类时“分类器”是经反复修定、调整逐步逼近形成的, 即通常采用迭代的方法构成。处理时,只在选定分类方法,设定分类集群数目,以及在迭代过程中决定是否中止过程时,人为地干预处理外,人为的干扰很少。因此,非监督分类客观而真实,特别适用于对工作地区了解较少或已知资料不多时,对遥感图像的分类。
非监督分类的成果最终也要到实地去检验验证。核对各个集群所对应的地物类型,检查评价分类的精度。