第四节 遥感图像的几种监督分类法
有了上面介绍的基本概念和基础知识,现在可以开始介绍具体的分类方法了。遥感图像分类法有两大类:监督分类和非监督分类。
监督分类也称训练场地法,根据先验的类别知识,选择有代表性的场地作试验样本特征参数的实际观测,如测其光谱特性参数,并且求其统计特征如平均值
协方差矩阵
和离散度等。由此初步建立一个判别函数,用来判别分类其它已知类别的样品,若分类精度不够,再修改调整或重建,直到分类精度满足要求为止。这样就可以应用最后的判别函数来作为正式分类的设计依据。这个过程就是前面介绍的有导师的学习过程,即监督学习,也就是监督分类。
监督人类的原理框图如图9-4-1所示。
![]()
图 9-4-1 监督分类框图
监督分类方法有许多种,如判别分析,序号分析,最大似然分析和监督分类的图形识别等。下面选择几种扼要介绍一下。
判别分析适用于变量呈正态分布的情况。如在卫星照片的地质分类中常被应用。其基本思路是将高维数矢量空间变换(投影)到低维矢量空间,从而使不同类别的目标物体特征参数尽可能地分开,便于判决分类的实现。从一个简单的例子开始,如图9-4-2(a)中有两类物体
和
,由于两类物体在
和
轴上分布有重迭,直接使用其中一个变量
或
是无法分开的。但如果将
和
变换(投影)到一个变量
上,使两类物体分布在
轴上投影中心(
和
)距离尽可能远,那么就可以选择两个投影中心的中点
作为判别点。其投影在
和
之间的任何
均判别为
类。在
之间的判别为
类。
![]()
(a) 二维到一维变量变换
![]()
(b) 判决函数的几何意义图 9-4-2 二维变量的判别分析
假定上述变换是线性变换,即
是
和
的线性函数,且表示为:
(9.4.1)
那么应用几何学知识就可以理解。根据
和
作一个平面
,使
与
平面相交
,从
面内物体
和
上的点向
平面作垂直线且和
平面相交,这些交点
平面的距离即为物体
和
上点对应的
值。由于P平面的走向和倾斜度是由
和
使物体
对应的
值尽可能“紧凑”,物体
对应的
值也尽可能“紧凑”。而使它们之间距离尽可能远。这样,就可以通过对味知点
值的判别来分类。因此
和
值的选择是关键。下面简单讨论一下。
设
二类物体所有点的总期望值点所对应的
值为
。
类各自内部点期望值点所对应的
值分别为
和
。
和
分别为
类内的点数。
为了使类内
值“紧凑”,即使其类内
值方差最小,而又希望类间
值相差大,即使其类间方差为最大,可通过下式运算:
(9.4.2 a)
趋于最大
(9.4.2 b)
趋于最小
式中:
类均值:
(9.4.3 a)
类均值:
(9.4.3 b)
两类均值:
(9.4.4)
式中:
(9.4.5 a)
(9.4.5 b)
(9.4.5 c)
(9.4.5 d)
(9.4.6 a)
(9.4.6 b)
将上述各式代入式(9.4.2)即可获得
(9.4.7 a)
(9.4.7 b)
式中:
(9.4.8 a)
为
的总方差,
(9.4.8 b)
为
的总方差,
(9.4.9)
为
和
的总方差。
为使
最大,
最小同时满足,即可要求
为最大,两边取对数。
(9.4.10)
亦为最大。
将式(9.4.10)分别对
和
求偏导数并令其为零,则得到
(9.4.11)
解此方程即可得到
和
为
(9.4.12)
(9.4.13)
以
类和
类所有点合在一起的总期望值点坐标
代入式(9.4.1)就可以得到为
(9.4.14a)
或
(9.4.14 b)
通常称式(9.4.14)为判别直线,如图(9.4.2)中的直线
。称
为判别指数,而式(9.4.1)即
![]()
一般称之为判别函数或判别方程。
以上讨论的是二类二维情况,二类多维情况依此类推。
设判决函数为:
(9.4.15)
式中,
由下列方程组解得
(9.4.16)
简化为
(9.4.17 a)
或
(9.4.17 b)
式中
(9.4.18)
称为
的协方差矩阵;
(9.4.19)
称为均差向量之列矩阵;
(9.4.20)
称为判别函数中系数
之列矩阵;
为
的逆矩阵。
可见根据式(9.4.17 b),可以求出的需要的所有
,代入式(9.4.1)即可得到判别函数。
若是多类多维将要建立多个判别函数,如二维三类就要二个判别函数,仅示意图9-4-3,不再讨论。
例9-3建立区分海滩砂和滨外砂的判别函数,并判别一个未知样本
是属于哪一类?
![]()
图 9-4-3 二维三类的判别分析解 ⑴确定训练场地
① 特征参数选择是根据需要和可能,应用服务对象学科的知识和经验来确定选用样本的什么参数对分类最合适。本例根据地学知识选用“中等颗粒大小”和“分选系统”作为两个特征,分别以
表示。
② 特征参数的测量,对
测量次数分别表示为
。
可以相等,也可以不等,但次数应足够多,能在统计意义上的效。假如实测结果为表9-4-1。
A类(海滩砂) B类(滨外沙)
中等颗粒大小 分选系数 中等颗粒大小 分选系数 0.333 1.08 0.339 1.12 0.340 1.08 0.336 1.12 0.338 1.09 0.350 1.12 0.333 1.10 0.3521.13
0.323 1.13 0.341 1.15 0.327 1.12 0.347 1.15 0.329 1.13 0.337 1.16 0.331 1.13 0.343 1.16 0.336 1.12 0.340 1.17 0.333 1.14 0.346 1.17 0.341 1.14 0.349 1.17 0.328 1.15 0.339 1.18 0.336 1.15 0.342 1.18 0.327 1.16 0.346 1.18 0.329 1.16 0.351 1.18 0.330 1.16 0.340 1.19 0.323 1.17 0.344 1.19 0.328 1.17 0.333 1.20 0.332 1.17 0.337 1.20 0.331 1.18 0.339 1.20 0.326 1.18 0.342 1.20 0.333 1.18 0.339 1.21 0.330 1.19 0.340 1.21 0.336 1.19 0.341 1.21 0.327 1.20 0.335 1.22 0.324 1.21 0.337 1.22 0.332 1.21 0.340 1.22 0.332 1.22 0.343 1.22 0.329 1.22 0.334 1.22 0.325 1.24 0.348 1.22 0.328 1.26 0.337 1.22 0.322 1.27 0.342 1.23 0.318 1.22 0.340 1.24 0.330 1.17 0.342 1.24 0.331 1.24 0.336 1.25 0.341 1.25 0.341 1.25 0.334 1.26 0.337 1.27 0.339 1.27 0.330 1.28 0.334 1.28 0.332 1.29 0.330 1.31 0.334 1.31 0.340 1.21表 9-4-1 海砂样本测量结果
③ 求各项均值
![]()
⑵求由式(9.4.19)均值差向量
:
![]()
(3)由式(9.4.18)求协方差矩阵
:
![]()
其中,
由式(9.4.8 a)求出,
![]()
由式(9.4.9)求出为
![]()
由式(9.4.8 b)求得为
![]()
(4)根据矩阵运算方法求出
之逆矩阵
为
![]()
其中
![]()
(5)由式(9.4.17 b)求出判别函数系数
:
![]()
即
![]()
(6)由式(9.4.1)确定判别函数为:
![]()
(7)由式(9.4.3 a 和 b)及公式(9.4.4)求出
为:
![]()
根据上述求得
类和
类中心判别值
以及判别指数
可画出其直方图如图9-4-4所示
图 9-4-4 A类和B类的直方图书馆
(8)判别未知样本,
属哪一为类?
![]()
因为未知样本的
值在
之间,故判此样本为
类,为海滨砂。作为例题计算到此可以结束。在实际应用过程中还有一些问题要说明一下。
① 若计算出
过于偏向
或
,可调整一下两类训练样本取数
和
。
② 对未知样本的
值到
与
之距离不要太大,一般情况下,应满足
![]()
若超过100往往不能判别为
类或者
类。
③为了分析分类效果优劣,往往再对其结果进行
检验。为此,简单介绍一下
检验方法。
![]()
式中
分别为
类和
类样品数。上例中
;
为变量个数,上例中
;
为
、
类中心距(称为马氏距离Mahanabis);
,对上例
![]()
代入
的表示式,可得上例的
。
由上例计算出
表中几个参数为
分子自由度
![]()
分母自由度
指定一个显著性水平
,如用
,则求出上限概率
为
![]()
由上述参数从
表中查得
,而上例计算的
远远大于查表值,表明此类分类效果好。
④ 为了找出判别函数中哪一个变量对分量相对贡献大,还可以进一步计算,设
为第
个变量的相对贡献。
![]()
式中:
为判别方程中第
个变量的系数。上例对
分别为
和
;
为两个类的第
个变量均值差,上例为
;
为马氏距离,上例为10.71。
代入这些参数,计算结果为
![]()
由此可以看出上例中
即“中等颗粒大不小”是分类的主要依据。而
即“分选系数为次要因素”。
序贯分析实际上是判别分析以序贯方式的多次应用。其过程可以用树状图来表示,图9-4-5给出两种常见的树状图。
图 9-4-5 两种树状图
图中,
为四个分类点,每个分类点处有一个判别函数与之对应。按分类点次序逐个应用对应的判别函数,即可将原始图样本分为多类。这里我们不再进行系统的理论分析,只结合一个具体的例子来说明一下分类过程,虽有其局限性,但仍不失一般性,或许概念反而明确具体,印象深刻。
例9-4 已知①训练组各分类点处各波段的亮度值如表9-2。
水
其他类
煤
其他类
水利工程
其他类
沙漠
其他类
11.05 29.45 11.05 29.72 25.79 29.97 34.02 27.28
7.98 43.04 10.52 43.53 37.01 43.93 52.84 38.03
2.52 46.33 9.15 46.87 56.66 46.26 56.57 39.43
0.05 36.74 3.30 37.23 52.19 36.30 44.57 30.56表 9-4-2
②各分类点见图9-4-5(a)处的判别函数分另别为:
![]()
求:试对表9-4-3的给的十个象素进行分类。
1 .8973 1.2420 1.929 1.384 2.150 1.553 2 .9018 1.0260 1.430 1.138 1.586 1.393 3 .8902 .9059 1.262 1.017 1.418 1.393 4 .0118 .0061 .0041 .5233 .3474 .0638 5 .7312 .7419 1.203 1.014 1.646 1.622 6 .7541 .8381 1.365 1.111 1.810 1.629 7 .4048 .3087 .2738 .7624 .6763 .6810 8 .7410 .6646 .9265 .8970 1.250 1.303 9 .7407 .7407 .8695 1.000 1.173 1.173 10 .8994 .9340 1.292 1.038 1.437 1.283表 9-4-3
解:
(1)计算两个分类中心
和
,以及判别指数
,
① 计算
处的
和
及
![]()
![]()
对
,
和
以同样的方法计算,其结果如下:
②
![]()
![]()
③
![]()
![]()
④
![]()
![]()
(2)将十个象素的比值变量(表9-3)依
,
,
和
次序代入各处判决函数
和
。
若能判别出属于哪一类,则结束这个象素的运算。否则再依次问下运算,直到求出该象素属何类为止。例如对第一个象素运算过程如下:
① 先用
计算
![]()
根据上步计算可见
![]()
故判第一象属“其它”类。必须继续运算,用
处判别函数进行运算:
![]()
因为
![]()
可见第1象素也不是煤,还要继续判别。将第一象素比值变量代入
处判别函数进行计算:
![]()
可见
,因此可以判决第一个象素是属于水利工程类。
(3)按同样方法计算其它9个象素的属类别见表9-4。
像
素
号
处
处
处
处
判别
结果
6.04
17.73
29.42
-97.23
-73
-47.6
-6.38
-58.9
-54
-96.92
-93.36
-89.80 1 28.6 -121.20 -57.89 水利
工程 2 19.5 -104.0 -52.02 -101.69 沙漠 3 29.4 -98.3 -77.2 -96.3 沙漠 4 3.54 水 5 29.4 -95.5 -64.7 -93 其他 6 29.4 -78.5 -62.9 -98.9 沙漠 7 22.3 -45.4 煤 8 28.5 -83.8 -65 -81.9 其他 9 29.2 -81.4 -47 水利
工程 10 29.5 -99.5 -64.1 -97.3 沙漠表 9-4-4
为了改进分类速度,往往按变量分类能力来排定分类次序,而变量分类能力以
值表示,
值大,分类能力强,最先使用分类,建立判别函数。
关于遥感图像分类的训练场地选择应注意以下几点:
① 训练组内的象素、物质要均匀,保证光谱特性均匀。
② 训练组内光谱特性应与卫片一样经大气校正。
③ 训练组内光谱特性曲线摄取要在和卫星拍摄时间相同,至少是同一天。
在某些情况下,例如遥感图像中一些类的物质波谱特性,虽经特征提取(就是相当于投影到
轴上的过程),但不能应用一根直线即线性判别函数把它们分开,必须建立一种非线性判别函数来分类。似然比判别分析就是一种非线性判别分析法。
似然比判别分析方法的主要概念是:有待分类的象点特征参数(灰度值、波段比值等)构成特征矢量
。如果其条件概率密度
和
以及先验概率
和
是已知的话,那么就可应用“最佳分类器”节中介绍的最小错误概率的贝叶斯判决方法,也就是最大似然判决。引用公式(9.2.3),其判别准则缩写为:
(9.4.21)
式中
往往称为似然比判别分析阙值。
为了运算方便,(9.4.21)式可用对数形式表示为
(9.4.22)
当条件概率密度
都是期望矢量
;协方差矩阵为
的正态分布的时候;变量
的维数为
。则
(9.4.23)
(9.4.24)
将式(9.4.22)变为:
![]()
(9.4.25)
由式(9.4.25)可见,这个似然比判别函数是
的二次型函数。如果是二维情况
,那么判别边界就是一条曲线,见图9-4-6(a)。如果还满足
时,则判别边界由曲线变为直线,见图9-4-6(b)和式(9.4.26)。
当
时,则式(9.4.25)变为:
(9.4.26)
图 9-4-6 两个正态分布的判决边界如果采用白化变换[9.22],使
(
为单位矩阵)时,则式(9.4.26)还可以简化为
(9.4.27)
或
(9.4.28)
式中:
(9.4.29 a)
(9.4.29 b)
其中式(9.4.29)中(a)和(b)式分别表示
到
距离的平方。
为
的维数,
为
的第
个分量;
分别表示
和
中的第
个分量;
为阈值。由此可见,式(9.4.28)的含义是:以阈值
为标准,比较
到
距离,当两个距离大于上述阈值标准时,判
属于
类。反之则判
属于
类。如果出现
和
,即阈值标准为0.5时,则判别边界最简单,为
连线的垂直平分线。
前面已介绍的几种分类方法,其判别函数是通过对已知象元样本采用统计方法来确定的。现在介绍一种不用统计方法而根据经验和试验办法来确定判别函数。首先根据图像内容和经验,先假定判别函数的形式的一组系数。然后用已知类别的象元样本来训练,也就是逐修正,直到获得满意的判别函数为止。这就是逐次参数估计的基本思路。它的优点是不需要知道那些概率和概率密度,从而带来了许多好处。下面以两个类别的分类为例来说明逐次参数估计方法的基本过程。
设待分类象点的特征矢量为
,对于两个类别的分类问题,根据经验可以用下面的判别规则:
(9.4.30)
式中
为要估计的参数向量,
为要分的类别。
将式(9.4.30)改写为下列形式
(9.4.31)
式中,
![]()
再按下列试验结果将
逐步修正为
。
①
(9.4.32)
此式表明:现在用的
,根据己知类别的象点样本判决结是果来看,是满足判别规则,即能够进行正确分类,故不再修正下去。所以就取
。
②若用己知类别象点样本试验判决结果出现:
则令
![]()
此式表明,根据己知类别的象点样本判决结果来看是错误的,也就是讲用这个判别函数是不能进行正确分类的,故必须进行修正。从式(9.4.33 a)来看,因为己知
,应当满足
,而试验运算结果却是
,表示
要增加,即
部要增加。(b)式反之。这样逐次修正下去,直到某一个
,如
满足式(9.4.33)为止,即取定
。那么式中的
如何确定呢?常用的有三种办法:固定增量法、绝对修正法和梯度修正法。下面用一个具体例子来介绍固定增量法实现修正的过程。
例 9-5 设有三个己知类别的象点样本,其各个分量值为表9-4-5。试用逐次参数估计方法建立判别函数。
表 9-4-5
表 9-4-6解:①根据
。由表(9-4-5)建立表9-4-6
②令
![]()
根据式(9.4.31)运算如下:
![]()
可见
不能用,需要修正,假设采用固定增量法,令
,按式(9.4.33 c)修正如下:
![]()
③将
代入式(9.4.31)运算如下(注意此时用
代入):
![]()
因为己知
,而
,故需继续众修正。由式(9.4.33 a)可见
![]()
④将
代入式(9.4.31)运算如下(此时用
代入):
![]()
故需再修正,如此按
依次代入反复运用式(9.4.31)运算,直到所有四个
都满足式(9.4.32)为止。具体计算过程见表9-4-7。
表 9-4-7⑤最后获得的
,那么判别函数为
![]()
对应的判别规则为
![]()
式中
。
最后说明一下,逐次参数估计在实际运用中有个迭代收敛问题,可以采用随机近似或其它方法予以解决。在此我们不再讨论。
五、监督分类的图形识别
已经讨论过的同几种监督分类方法,总是根据己知象元样本,采用不同方法先建立一个判别函数,然后对待分类的象点进行分类。而图形识别方法,并不去建立判别函数,而是根据己知象点建立一条特征曲线。特征曲线的作用等效于判别函数。
1.特征曲经线的建立
特征曲线是由训练区样本的某些特处征参数构成,如卫片中某几个已知象元
和
波段的灰度值,见表9-4-8,那么就可以由此建立其特征曲线如图像9-4-7所示。
表 9-4-8
图 9-4-7 特征曲线索
应用特征曲线进行识别分类有两各种方法:严格分类(无窗口分类)和不严格分类(有窗口分类)。其原理很简单,以例说明即可以。
2.无窗口识别分类法:
例 9-6 设己知矿区所在地图像象点的光谱特征曲线为图9-4-7中
所示。试分析表9-4-8所示的三个象点所在地是否有矿。
解: ① 先将己知矿区所在地象点的光谱特征曲线画成曲线如9-4-7中
(画图时可多选几个象点,取平均值)。
② 再将待识别的象点特征曲线也画在同一图中,如图9-4-7中
。
③ 将
和
与
比较,基本一致的认出为同属一类。从图中可见
与
基本重合,则认为3号象点所在地有矿。其它两个象点与
差别很大,则认为是无矿区象点。
3.有窗口识别分类法:
基本方法同无窗口识别分类相似,只是将特征曲线
变成一个以
为中心的一个区域范围,称此为窗口。在识别分类时,凡是象元特征曲线落在此窗口内的即可认为同属一类。显然这种分类方法的精度取决于窗口尺寸大小。常用的有10%和20%窗口两种。当然,选用什么特征视图像内容和经验决定。