监督分类一般是先在图像中选取已知样本 ( 训练区) 的统计数据,从中找出分类的参数、条件,建立判别函数,然后对整个图像或待分类像元作出判别归类。遥感图像处理中常用的监督分类方法有最小距离法、贝叶斯线性和非线性判别法 ( 最大似然法) 、多级分割法 ( 平行六面体法) 、特征曲线法 ( 光谱角法) 、马氏距离法、费歇尔线性判别法等。
1. 最小距离法
最小距离法的基本原理是根据已知类别或训练样本的模式特征选择特征参数并建立判别函数,通过待分类像元与各类别均值向量的距离比较而将其划分至与之距离最小的类别之中。为保证分类精度,需要对特征空间进行正交变换 ( 如 K-L 变换等) 。首先在图像显示屏上选出训练样区,并且从图像数据中求出训练样区各个波段的均值和标准差; 而后再去计算其他各像元的亮度值向量到训练区波谱均值向量之间的距离。该方法依据的分类指标为绝对值距离或欧氏距离,其中欧氏距离最为常用。如果距离小于指定的阈值 ( 一般取标准差的倍数) ,且与某一类的距离最近,遂将该像元归为某类。该分类法的精度取决于训练样区 ( 地物类别) 的多少和样本区的统计精度。由于计算简便,并可按像元顺序逐一扫描归类,一般分类效果也较好,因而是较常用的监督分类方法。
图 4-23 ISODATA 方法框图
2. 贝叶斯线性和非线性判别法 ( 最大似然法)
该方法假定各类别总体的概率密度分布均为正态分布,通过待分类像元与各类别的似然率比较而将其划分至与之似然率最大的类别之中。其分类指标为似然率 ( 条件概率) 。它是用贝叶斯判别原则进行分析的一种非线性监督分类。简单地说,它可以假定已知的或确定的训练样区典型标准的先验概率,然后把某些特征归纳到某些类型的函数中,根据损失函数的情况,在损失最小时获得最佳判别。该法分类效果较好,但运算量较大。
3. 多级分割法 ( 平行六面体法)
多级分割法的基本原理是在特征空间中每个特征变量轴上设置一系列的分割点 ( 依据训练数据的统计特征进行分割点的确定) ,将多维特征空间划分为互不重叠的子空间,每个子空间对应于一个分类类别,将分类像元归属于与其所在子空间相对应的类别。为提高分类精度,需要对特征空间进行正交变换 ( 如 K-L 变换等) 。
4. 特征曲线法 ( 光谱角法)
特征曲线法的基本原理是以地物的特征参数曲线 ( 如地物波谱特性曲线) 之间的相似系数 ( 变量空间中样品点向量之间的夹角余弦) 作为分类判别指标。
5. 马氏距离法
马氏距离法充分考虑了多维变量空间中反映样本点随机概率密度分布特征的协方差矩阵,当各变量正交时其相当于加权的欧氏距离,故该方法相对于最小距离法等方法而言一般具有较好的分类识别效果。
监督分类的结果明确,分类精度相对较高,但对训练样本的要求较高,因此,使用时须注意应用条件,某一地区建立的判别式对别的地区不一定完全适用。此外,有时训练区并不能完全包括所有的波谱样式,会造成一部分像元找不到归属。故实际工作中,监督分类和非监督分类常常是配合使用,互相补充的,使分类的效率和精度进一步提高。
基于最大似然原理的监督法分类的优势在于如果空间聚类呈现正态分布,那么它会减小分类误差,而且分类速度较快。监督法分类主要缺陷是必须在分类前圈定样本性质单一的训练样区,而这可以通过非监督法来进行,即通过非监督法将一定区域聚类成不同的单一类别,监督法再利用这些单一类别区域 “训练”计算机。通过 “训练”后的计算机将其他区域分类完成,这样避免了使用速度比较慢的非监督法对整个影像区域进行分类,在分类精度得到保证的前提下,分类速度得到了提高。具体可按以下步骤进行。
第一步,选择一些有代表性的区域进行非监督分类。这些区域尽可能包括所有感兴趣的地物类别。这些区域的选择与监督法分类训练样区的选择要求相反,监督法分类训练样区要求尽可能单一。而这里选择的区域包含类别尽可能得多,以便使所有感兴趣的地物类别都能得到聚类。
第二步,获得多个聚类类别的先验知识。这些先验知识的获取可以通过判读和实地调查得到。聚类的类别作为监督分类的训练样区。
第三步,特征选择。选择最适合的特征图像进行后续分类。
第四步,使用监督法对整个影像进行分类。根据前几步获得的先验知识以及聚类后的样本数据设计分类器,并对整个影像区域进行分类。
第五步,输出标记图像。由于分类结束后影像的类别信息也已确定,所以可以将整幅影像标记为相应类别输出。
图像分类处理目前在农林、土地资源遥感调查中应用较广。对于地质体的分类,由于干扰因素较大,一般要经变换 ( 比值变换、K-L 变换等) 处理的图像再作分类处理,现常用于岩性填图或热液蚀变填图等,随着计算机软硬件技术的日益成熟,图像的计算机分类将应用得越来越普遍。
复习思考题
1. 数字图像的基本概念是什么?
2. 数字图像的存储格式有哪几类?
3. 遥感单波段和多波段数据基本统计量有哪些?
4. 什么是辐射误差? 其主要来源有哪些?
5. 什么是大气校正? 试说明回归分析和直方图校正的原理。
6. 简述利用重采样法进行几何精校正的过程。
7. 什么是投影变换、图像镶嵌和图像分幅?
8. 什么是线性扩展和非线性扩展? 常用非线性增强方法有哪几种?
9. 什么是多波段假彩色合成?
10. 比值、差值增强的基本功能是什么?
11. 滤波增强的主要目的是什么? 常用的方法有哪些?
12. K - L 变换和 K-T 变换的主要作用是什么?
13. 什么是非监督分类? 本章介绍了哪几种方法?
14. 什么是监督分类? 有哪几种方法?
15. 简述监督分类与非监督分类的区别,各有何优点和适用条件。