基于Pinball损失函数支持向量机的极化SAR图像鲁棒分类

张腊梅 张思雨 董洪伟 朱厦

引用本文:
Citation:

基于Pinball损失函数支持向量机的极化SAR图像鲁棒分类

    作者简介: 张腊梅(1980–),女,博士,副教授,博士生导师。2010年在哈尔滨工业大学获得博士学位,2014至2015年在加拿大曼尼托巴大学作访问学者,现为哈尔滨工业大学副教授。主要研究方向包括SAR/极化SAR图像智能处理和应用,极化干涉SAR信息提取,目标电磁散射特性分析和仿真。在国内外著名学术刊物和国际会议上发表学术论文80多篇,授权/受理发明专利10多项,担任哈尔滨IEEE GRSS秘书。E-mail: lmzhang@hit.edu.cn;张思雨(1997–),男,黑龙江哈尔滨人,学士。2019年在大连海事大学电子信息工程专业获得学士学位,现为哈尔滨工业大学信息与通信工程学院硕士研究生。研究方向为SAR/PolSAR图像处理与智能解译、模式识别与机器学习。E-mail: missrain2831@163.com;董洪伟(1994–),男,山东济南人,硕士。2018年在中国农业大学理学院数学系获得硕士学位,现为哈尔滨工业大学信息与通信工程专业博士研究生。研究方向为计算机视觉、模式识别与机器学习及SAR图像图像解译。E-mail: donghongwei1994@163.com;朱 厦(1984–),女,博士,助理研究员。2012年在法国巴黎十一大学获得国家物理学博士学位,2018年在法国国家科学院信号与系统LSS实验室作访问学者,现为北京市遥感信息研究所助理研究员,主要从事微波卫星应用总体、极化SAR信息处理和海洋遥感方面的研究工作。发表学术论文30余篇,主持国家863计划等多项科研课题,先后受国家“建设高水平大学”公派研究生项目、国家外专局“智力引进计划”资助,获省部级科技进步二等奖1项。E-mail: nudt_zs@163.com.
    通讯作者: 朱厦, nudt_zs@163.com
  • 基金项目:

    国家自然科学基金(61401124, 61871158),航空科学基金(20182077008),黑龙江省留学归国人员科学基金(LC2018029)

  • 中图分类号: TP391

Robust Classification of PolSAR Images Based on Pinball loss Support Vector Machine

    Corresponding author: ZHU Sha, nudt_zs@163.com
  • Fund Project: The National Natural Science Foundation of China (61401124, 61871158), The Aeronautical Science Foundation of China (20182077008), The Scientific Research Foundation for the Returned Overseas Scholars of Heilongjiang Province (LC2018029)

    CLC number: TP391

  • 摘要: 考虑到极化合成孔径雷达(PolSAR)图像标注信息量低以及相干斑噪声难以消除的问题,该文从鲁棒统计学习的角度提出了一种基于Pin-SVM的极化SAR图像鲁棒分类方法,根据极化SAR图像的散射特性和地物的纹理特性,通过求解两类样本之间的最大分位数距离来确定分类超平面,在无需迭代的前提下得到更加鲁棒的分类结果。相比传统的基于最大间隔的极化SAR图像分类算法,该文所提算法一方面在对极化SAR图像提取到的特征中包含的噪声具有更好的鲁棒性,另一方面对于训练样本的抽样范围不敏感,即重采样具有更好的鲁棒性。利用EMISAR的Foulum地区极化SAR数据进行了算法验证,多种情况的对比实验的结果验证了该算法的有效性。
  • 图 1  0-1损失、Hinge损失与Pinball损失的对比

    Figure 1.  The form of 0-1 loss, Hinge loss and Pinball loss

    图 2  不同超参数$\tau $取值下Pin-SVM分类示意图

    Figure 2.  Schematic diagram of Pin-SVM classification with different hyperparameter $\tau $

    图 3  基于Pin-SVM的极化SAR图像分类流程

    Figure 3.  Flowchart of PolSAR classification based on Pin-SVM

    图 4  Foulum地区EMISAR实验数据

    Figure 4.  EMISAR experimental datas of Foulum test site

    图 5  EMISAR图像分类结果对比

    Figure 5.  Classification results comparison of EMISAR image

    图 6  不同分类器对各地物分类精度的对比图

    Figure 6.  The comparison of the classification accuracy of different terrains

    图 7  分类器预测的概率密度函数对比

    Figure 7.  Comparison of probability density functions for the prediction of classifiers

    图 8  重采样的鲁棒性评估

    Figure 8.  Robustness evaluation of resampling

    图 9  Pin-SVM的参数对分类精度的影响

    Figure 9.  The effect hyperparameters of Pin-SVM on classification accuracy

    表 1  不同分类器对测试样本的分类精度(%)

    Table 1.  Classification accuracy comparison of different classifiers

    分类器地物类型整体精度
    建筑物森林裸地细径作物阔叶作物
    Pin-SVM94.390.795.182.394.191.3
    C-SVM91.080.692.380.189.786.7
    Wishart85.471.293.784.285.684.0
    LSSVM86.280.289.378.888.284.5
    OPTELM86.582.392.175.183.884.0
    下载: 导出CSV

    表 2  重采样实验结果

    Table 2.  Experimental results of the resampling

    分类器重采样
    30次50次100次150次
    Pin-SVMw$8.96 \pm 1.11$$8.69 \pm 0.99$$8.57 \pm 0.96$$8.63 \pm 0.95$
    $\tau {\rm{ = }}1.0$b$ - 5.91 \pm 0.62$$ - 5.95 \pm 0.61$$ - 5.93 \pm 0.59$$ - 5.93 \pm 0.44$
    Pin-SVMw$9.43 \pm 1.23$$9.54 \pm 1.20$$9.42 \pm 1.15$$9.68 \pm 1.13$
    $\tau {\rm{ = 0}}{\rm{.5}}$b$ - 6.93 \pm 0.75$$ - 7.02 \pm 0.71$$ - 6.91 \pm 0.67$$ - 6.85 \pm 0.59$
    Pin-SVMw$11.43 \pm 1.63$$11.22 \pm 1.47$$11.09 \pm 1.46$$11.31 \pm 1.44$
    $\tau {\rm{ = 0}}{\rm{.2}}$b$ - 8.53 \pm 0.84$$ - 8.53 \pm 0.78$$ - 8.41 \pm 0.75$$ - 8.39 \pm 0.73$
    Pin-SVMw$12.30 \pm 1.84$$12.12 \pm 1.74$$12.23 \pm 1.61$$12.09 \pm 1.59$
    $\tau {\rm{ = 0}}{\rm{.1}}$b$ - 9.57 \pm 1.02$$ - 9.88 \pm 0.99$$ - 9.50 \pm 0.97$$ - 9.62 \pm 0.92$
    C-SVMw$13.29 \pm 1.96$$12.98 \pm 1.87$$13.42 \pm 1.73$$13.12 \pm 1.69$
    b$ - 16.15 \pm 3.04$$ - 15.81 \pm 2.74$$ - 15.92 \pm 2.45$$ - 15.48 \pm 2.28$
    下载: 导出CSV
  • [1] CHEN Qiang, KUANG Gangyao, LI J, et al. Unsupervised land cover/land use classification using PolSAR imagery based on scattering similarity[J]. IEEE Transactions on Geoscience and Remote Sensing, 2013, 51(3): 1817–1825. doi: 10.1109/tgrs.2012.2205389
    [2] LI Wenmei, CHEN Erxue, LI Zengyuan, et al. Forest aboveground biomass estimation using polarization coherence tomography and PolSAR segmentation[J]. International Journal of Remote Sensing, 2015, 36(2): 530–550. doi: 10.1080/01431161.2014.999383
    [3] FOUCHER S, LANDRY T, LÓPEZ-MARTÍNEZ C, et al. An evaluation of PolSAR speckle filters on compact-pol images[C]. Proceedings of 2012 IEEE International Geoscience and Remote Sensing Symposium, Munich, Germany, 2012: 5089–5092. doi: 10.1109/IGARSS.2012.6352466.
    [4] LIU Xunan and CHENG Bo. Polarimetric SAR speckle filtering for high-resolution SAR images using RADARSAT-2 POLSAR SLC data[C]. Proceedings of 2012 International Conference on Computer Vision in Remote Sensing, Xiamen, China, 2012: 329–334. doi: 10.1109/CVRS.2012.6421284.
    [5] 滑文强, 王爽, 侯彪. 基于半监督学习的SVM-Wishart极化SAR图像分类方法[J]. 雷达学报, 2015, 4(1): 93–98. doi: 10.12000/JR14138HUA Wenqiang, WANG Shuang, and HOU Biao. Semi-supervised learning for classification of polarimetric SAR images based on SVM-Wishart[J]. Journal of Radars, 2015, 4(1): 93–98. doi: 10.12000/JR14138
    [6] ZHANG Yue, ZOU Huanxin, SHAO Ningyuan, et al. Unsupervised classification of polsar imagery based on consensus similarity network fusion[C]. Proceedings of 2017 IEEE International Geoscience and Remote Sensing Symposium, Fort Worth, USA, 2017: 3266–3269. doi: 10.1109/IGARSS.2017.8127694.
    [7] BI Haixia, SUN Jian, and XU Zongben. Unsupervised PolSAR image classification using discriminative clustering[J]. IEEE Transactions on Geoscience and Remote Sensing, 2017, 55(6): 3531–3544. doi: 10.1109/TGRS.2017.2675906
    [8] FERRO-FAMIL L, POTTIER E, and LEE J S. Unsupervised classification of multifrequency and fully polarimetric SAR images based on the H/A/Alpha-Wishart classifier[J]. IEEE Transactions on Geoscience and Remote Sensing, 2001, 39(11): 2332–2342. doi: 10.1109/36.964969
    [9] SHANG Fang and HIROSE A. Use of Poincare sphere parameters for fast supervised PolSAR land classification[C]. Proceedings of 2013 IEEE International Geoscience and Remote Sensing Symposium, Melbourne, Australia, 2013: 3175–3178. doi: 10.1109/IGARSS.2013.6723501.
    [10] DABBOOR M and SHOKR M. A new likelihood ratio for supervised classification of fully polarimetric SAR data: An application for sea ice type mapping[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2013, 84: 1–11. doi: 10.1016/j.isprsjprs.2013.06.010
    [11] ZHANG Lamei, SUN Liangjie, ZOU Bin, et al. Fully polarimetric SAR image classification via sparse representation and polarimetric features[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2015, 8(8): 3923–3932. doi: 10.1109/JSTARS.2014.2359459
    [12] HE Kaiming, ZHANG Xiangyu, REN Shaoqing, et al. Deep residual learning for image recognition[C]. Proceedings of 2016 IEEE Conference on Computer Vision and Pattern Recognition, Las Vegas, USA, 2016: 770–778. doi: 10.1109/CVPR.2016.90.
    [13] VAPNIK V N. The Nature of Statistical Learning Theory[M]. New York, US: Springer-Verlag, 2000: 267–290. doi: 10.1007/978-1-4757-3264-1.
    [14] MAGHSOUDI Y, COLLINS M J, and LECKIE D G. Radarsat-2 polarimetric SAR data for boreal forest classification using SVM and a wrapper feature selector[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2013, 6(3): 1531–1538. doi: 10.1109/JSTARS.2013.2259219
    [15] CHEN Wenshuai, HAI Dong, GOU Shuiping, et al. Classification of PolSAR images based on SVM with Self-Paced learning optimization[C]. Proceedings of 2018 IEEE International Geoscience and Remote Sensing Symposium, Valencia, Spain, 2018: 4491–4494. doi: 10.1109/IGARSS.2018.8517452.
    [16] SUYKENS J A K and VANDEWALLE J. Least squares support vector machine classifiers[J]. Neural Processing Letters, 1999, 9(3): 293–300. doi: 10.1023/a:1018628609742
    [17] WANG Yidan, YANG Liming, and YUAN Chao. A robust outlier control framework for classification designed with family of homotopy loss function[J]. Neural Networks, 2019, 112: 41–53. doi: 10.1016/j.neunet.2019.01.013
    [18] BO Liefeng, WANG Ling, and JIAO Licheng. Recursive finite newton algorithm for support vector regression in the primal[J]. Neural Computation, 2007, 19(4): 1082–1096. doi: 10.1162/neco.2007.19.4.1082
    [19] WU Yichao and LIU Yufeng. Robust truncated hinge loss support vector machines[J]. Journal of the American Statistical Association, 2007, 102(479): 974–983. doi: 10.1198/016214507000000617
    [20] LIU Dalian, SHI Yong, and TIAN Yingjie. Ramp loss nonparallel support vector machine for pattern classification[J]. Knowledge-Based Systems, 2015, 85: 224–233. doi: 10.1016/j.knosys.2015.05.008
    [21] HUANG Xiaolin, SHI Lei, and SUYKENS J A K. Support vector machine classifier with pinball loss[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2014, 36(5): 984–997. doi: 10.1109/tpami.2013.178
    [22] BO Liefeng, WANG Ling, and JIAO Licheng. Feature scaling for kernel fisher discriminant analysis using leave-one-out cross validation[J]. Neural Computation, 2006, 18(4): 961–978. doi: 10.1162/neco.2006.18.4.961
    [23] SCHOLKOPF B, MIKA S, BURGES C J C, et al. Input space versus feature space in kernel-based methods[J]. IEEE Transactions on Neural Networks, 1999, 10(5): 1000–1017. doi: 10.1109/72.788641
    [24] ZHANG Lamei, ZOU Bin, CAI Hongjun, et al. Multiple-component scattering model for polarimetric SAR image decomposition[J]. IEEE Geoscience and Remote Sensing Letters, 2008, 5(4): 603–607. doi: 10.1109/lgrs.2008.2000795
    [25] CLOUDE S R and POTTIER E. An entropy based classification scheme for land applications of polarimetric SAR[J]. IEEE Transactions on Geoscience and Remote Sensing, 1997, 35(1): 68–78. doi: 10.1109/36.551935
    [26] HARALICK R M, SHANMUGAM K, and DINSTEIN I. Textural features for image classification[J]. IEEE Transactions on Systems, Man, and Cybernetics, 1973, SMC-3(6): 610–621. doi: 10.1109/TSMC.1973.4309314
    [27] DEKKER R J. Texture analysis of urban areas in ERS SAR imagery for map updating[C]. Proceedings of IEEE/ISPRS Joint Workshop on Remote Sensing and Data Fusion over Urban Areas, Rome, Italy, 2001: 226–230. doi: 10.1109/DFUA.2001.985885.
    [28] LEE J S, GRUNES M R, and DE GRANDI G. Polarimetric SAR speckle filtering and its implication for classification[J]. IEEE Transactions on Geoscience and Remote Sensing, 1999, 37(5): 2363–2373. doi: 10.1109/36.789635
  • [1] 滑文强王爽侯彪 . 基于半监督学习的SVM-Wishart极化SAR图像分类方法. 雷达学报, 2015, 4(1): 93-98. doi: 10.12000/JR14138
    [2] 杨文钟能严天恒杨祥立 . 基于黎曼流形的极化SAR图像分类. 雷达学报, 2017, 6(5): 433-441. doi: 10.12000/JR17031
    [3] 邹焕新罗天成张月周石琳 . 基于组合条件随机场的极化SAR图像监督地物分类. 雷达学报, 2017, 6(5): 541-553. doi: 10.12000/JR16109
    [4] 张向荣于心源唐旭侯彪焦李成 . 基于马尔科夫判别谱聚类的极化SAR图像分类方法. 雷达学报, 2019, 8(4): 425-435. doi: 10.12000/JR19059
    [5] 邢艳肖张毅李宁王宇胡桂香 . 一种联合特征值信息的全极化SAR图像监督分类方法. 雷达学报, 2016, 5(2): 217-227. doi: 10.12000/JR16019
    [6] 洪文 . 基于混合极化架构的极化SAR:原理与应用(中英文). 雷达学报, 2016, 5(6): 559-595. doi: 10.12000/JR16074
    [7] 胡涛李卫华秦先祥王鹏余旺盛李军 . 基于深度卷积神经网络和条件随机场模型的PolSAR图像地物分类方法. 雷达学报, 2019, 8(4): 471-478. doi: 10.12000/JR18065
    [8] 张杰张晰范陈清孟俊敏 . 极化SAR在海洋探测中的应用与探讨. 雷达学报, 2016, 5(6): 596-606. doi: 10.12000/JR16124
    [9] 计科峰王海波冷祥光邢相薇康利鸿 . 星载简缩极化SAR船舶目标检测技术研究. 雷达学报, 2016, 5(6): 607-619. doi: 10.12000/JR16083
    [10] 陈诗强洪文 . 基于极化轴比参数的圆极化波发射误差分析方法. 雷达学报, 2019, 8(): 1-11. doi: 10.12000/JR19063
    [11] 赵飞翔刘永祥霍凯 . 一种基于Dropout约束深度极限学习机的雷达目标分类算法. 雷达学报, 2018, 7(5): 613-621. doi: 10.12000/JR18048
    [12] 孙勋黄平平涂尚坦杨祥立 . 利用多特征融合和集成学习的极化SAR图像分类. 雷达学报, 2016, 5(6): 692-700. doi: 10.12000/JR15132
    [13] 陶臣嵩陈思伟李永祯肖顺平 . 结合旋转域极化特征的极化SAR地物分类. 雷达学报, 2017, 6(5): 524-532. doi: 10.12000/JR16131
    [14] 徐丰王海鹏金亚秋 . 深度学习在SAR目标识别与地物分类中的应用. 雷达学报, 2017, 6(2): 136-148. doi: 10.12000/JR16130
    [15] 折小强仇晓兰雷斌张薇卢晓军 . 一种极化熵结合混合GEV模型的全极化SAR潮间带区域地物分类方法. 雷达学报, 2017, 6(5): 554-563. doi: 10.12000/JR16149
    [16] 钟能杨文杨祥立郭威 . 基于混合Wishart模型的极化SAR图像非监督分类. 雷达学报, 2017, 6(5): 533-540. doi: 10.12000/JR16133
    [17] 滑文强王爽郭岩河谢雯 . 基于邻域最小生成树的半监督极化SAR图像分类方法. 雷达学报, 2019, 8(4): 458-470. doi: 10.12000/JR18104
    [18] 段晓菲刘志文徐友根 . 四元数域宽带鲁棒自适应波束形成. 雷达学报, 2019, 8(1): 117-124. doi: 10.12000/JR18083
    [19] 邹焕新李美霖马倩孙嘉赤曹旭秦先祥 . 一种基于张量积扩散的非监督极化SAR图像地物分类方法. 雷达学报, 2019, 8(4): 436-447. doi: 10.12000/JR19057
    [20] 张月邹焕新邵宁远周石琳计科峰 . 一种用于极化SAR图像的快速超像素分割算法. 雷达学报, 2017, 6(5): 564-573. doi: 10.12000/JR17018
  • 加载中
图(9)表(2)
计量
  • 文章访问数:  849
  • HTML浏览量:  87
  • PDF下载量:  48
  • 被引次数: 0
出版历程
  • 收稿日期:  2019-05-01
  • 录用日期:  2019-07-12
  • 网络出版日期:  2019-07-26
  • 刊出日期:  2019-08-28

基于Pinball损失函数支持向量机的极化SAR图像鲁棒分类

    通讯作者: 朱厦, nudt_zs@163.com
    作者简介: 张腊梅(1980–),女,博士,副教授,博士生导师。2010年在哈尔滨工业大学获得博士学位,2014至2015年在加拿大曼尼托巴大学作访问学者,现为哈尔滨工业大学副教授。主要研究方向包括SAR/极化SAR图像智能处理和应用,极化干涉SAR信息提取,目标电磁散射特性分析和仿真。在国内外著名学术刊物和国际会议上发表学术论文80多篇,授权/受理发明专利10多项,担任哈尔滨IEEE GRSS秘书。E-mail: lmzhang@hit.edu.cn;张思雨(1997–),男,黑龙江哈尔滨人,学士。2019年在大连海事大学电子信息工程专业获得学士学位,现为哈尔滨工业大学信息与通信工程学院硕士研究生。研究方向为SAR/PolSAR图像处理与智能解译、模式识别与机器学习。E-mail: missrain2831@163.com;董洪伟(1994–),男,山东济南人,硕士。2018年在中国农业大学理学院数学系获得硕士学位,现为哈尔滨工业大学信息与通信工程专业博士研究生。研究方向为计算机视觉、模式识别与机器学习及SAR图像图像解译。E-mail: donghongwei1994@163.com;朱 厦(1984–),女,博士,助理研究员。2012年在法国巴黎十一大学获得国家物理学博士学位,2018年在法国国家科学院信号与系统LSS实验室作访问学者,现为北京市遥感信息研究所助理研究员,主要从事微波卫星应用总体、极化SAR信息处理和海洋遥感方面的研究工作。发表学术论文30余篇,主持国家863计划等多项科研课题,先后受国家“建设高水平大学”公派研究生项目、国家外专局“智力引进计划”资助,获省部级科技进步二等奖1项。E-mail: nudt_zs@163.com
  • ①. 哈尔滨工业大学电子与信息工程学院 哈尔滨 150001
  • ②. 北京市遥感信息研究所 北京 100192
基金项目:  国家自然科学基金(61401124, 61871158),航空科学基金(20182077008),黑龙江省留学归国人员科学基金(LC2018029)

摘要: 考虑到极化合成孔径雷达(PolSAR)图像标注信息量低以及相干斑噪声难以消除的问题,该文从鲁棒统计学习的角度提出了一种基于Pin-SVM的极化SAR图像鲁棒分类方法,根据极化SAR图像的散射特性和地物的纹理特性,通过求解两类样本之间的最大分位数距离来确定分类超平面,在无需迭代的前提下得到更加鲁棒的分类结果。相比传统的基于最大间隔的极化SAR图像分类算法,该文所提算法一方面在对极化SAR图像提取到的特征中包含的噪声具有更好的鲁棒性,另一方面对于训练样本的抽样范围不敏感,即重采样具有更好的鲁棒性。利用EMISAR的Foulum地区极化SAR数据进行了算法验证,多种情况的对比实验的结果验证了该算法的有效性。

English Abstract

    • 合成孔径雷达是非常成熟的一种主动模式微波遥感技术,不依赖于太阳光源,不受云、雾、雨、雪等自然气候影响,具备全天候、全天时的对地观测能力。极化SAR通过发射两个相互正交的电磁波,结合电磁波的极化信息以及合成孔径雷达(Synthetic Aperture Radar, SAR)的优良特性从而更加有效地对地面进行观测,在地物与土地利用[1]、海洋表面遥感、绿色植物覆盖[2]等方面发挥了重要作用。图像分类一直是极化SAR图像解译中的重要部分。对于极化SAR图像而言,限制分类精度的主要因素在于噪声。尽管对极化SAR图像的滤波方法有很多[3,4],但都无法完全去除噪声的影响,并且在进行极化SAR图像监督分类时,训练样本的标定范围随机性很强,存在重采样问题。

      随着机器学习的发展,大量半监督[5]、无监督[68]和全监督[911]的分类方法被应用于极化SAR图像分类。相比全监督的方法,无监督的图像分类方法省略了人为标注的过程,但由于其分类精度无法令人满意,因此应用水平较低。目前基于深度表示学习的方法展现了更好的数据拟合能力[12],但训练神经网络所需的海量监督信息是极化SAR图像分类任务中所不具备的。在大量机器学习经典算法中,支持向量机[13]方法因其在小样本情况下表现出很好的学习能力和泛化能力,在极化SAR图像分类中的应用最为广泛[14,15]。但是,原始的C-SVM(Support Vector Machine)通过求解两类之间的最大间隔来确定分类超平面,其分类效果很容易受到噪声和样本采样区域的影响[16],因此鲁棒SVM一直以来被广泛的研究[17,18],但多数研究是以大幅提高算法复杂度为代价得到的鲁棒算法[19,20]。Huang等人[21]提出的基于Pinball损失函数支持向量机Pinball loss Support Vector Machine (Pin-SVM),通过求解最大分位数距离,在较小的复杂度下提高分类器的稳定性和鲁棒性。

      本文从契合实际应用环境的角度,提出一种基于Pin-SVM的极化SAR图像分类方法。算法利用融合后的极化SAR图像的散射和纹理特征,使用网格搜索与交叉验证结合的方式[22]寻找最优超参数组合,求解最大分位数距离以确定SVM的分类超平面,以较低的算法复杂度实现对特征噪声和重采样具有较好鲁棒性的极化SAR图像分类。

    • 对于$l$个训练样本的集合$\left\{ {{x_i},{y_i}} \right\},i = 1,2, ·\!·\!· ,l$,其中,${x_i} \in {{\rm{R}}^n}$表示样本$i$的特征,${y_i}$表示样本$i$被标记的类别,对于预测函数$f(x)$,通常用损失函数$L\left( {{x_i},{y_i},f({x_i})} \right)$来描述预测值与真实值之间的差异。传统的C-SVM的基本思想是通过优化Hinge损失函数的经验风险以及模型的结构风险,寻找一个最优的分类超平面$f\left( x \right) = {{{w}}^{\rm{T}}}x + b = 0,\;{{w}} \in {{\rm R} ^n},\; $$ b \in {\rm R}$,使两类之间的间隔最大,SVM的目标函数为

      $\mathop {\min }\limits_{{{w}},b} \frac{1}{2}{\left\| {{w}} \right\|^2} + C\sum\limits_{i = 1}^l {{L_{{\rm{Hinge}}}}\left[ {1 - {y_i}\left( {{{{w}}^{\rm{T}}} \cdot {x_i} + b} \right)} \right]} $

      其中,${L_{{\rm{Hinge}}}}\left( {x,y,f\left( x \right)} \right) = \max \left\{ {1 - yf\left( x \right),0} \right\}$,超参数$C\,$用于平衡经验风险与结构风险。

      Huang等人[21]根据分位数距离求解分类间隔,基于Pinball损失函数使分位数距离最大化。Pinball损失函数通过对正确分类的样本附加一定的惩罚以提高对特征噪声及重采样的不敏感性,Pinball损失函数的表达式为

      $ {L_\tau }\left( {x,y,f\left( x \right)} \right) = \left\{ \begin{aligned} {\rm{}}& {1 - yf\left( x \right),}\\ {\rm{}}& \quad {1 - yf\left( x \right) \ge 0}\\ {\rm{}}& { - \tau \left( {1 - yf\left( x \right)} \right),}\\ {\rm{}}& \quad {1 - yf\left( x \right) < 0} \end{aligned} \right. $

      其中,$\tau \in [0,1]$表示对正确分类样本的惩罚参数,用来控制两类之间的分位数距离。图1(a)图1(b)分别给出了C-SVM和Pin-SVM算法不同损失函数的性能对比,从图1中可以看出:在分类间隔$yf\left( x \right) < 1$的部分,Hinge损失与Pinball损失是一致的;在分类间隔$yf\left( x \right) \ge 1$的部分,Hinge损失函数的值恒为零;而Pinball损失函数的值为$ - \tau \left( {1 - yf(x)} \right)$,这意味着对Pin-SVM来说,即使分类正确也会有一定的损失。

      图  1  0-1损失、Hinge损失与Pinball损失的对比

      Figure 1.  The form of 0-1 loss, Hinge loss and Pinball loss

      将式(2)带入到式(1)中可得Pin-SVM的基本形式

      $\mathop {\min }\limits_{{{w}},b} \frac{1}{2}{\left\| {{w}} \right\|^2} + C\sum\limits_{i = 1}^l {{L_\tau }\left[ {1 - {y_i}\left( {{{{w}}^{\rm{T}}} \cdot {x_i} + b} \right)} \right]} $

      对于非线性分类问题,根据Mercer定理[23],可以用映射函数$\phi \left( {{x}} \right)$将原始数据集合映射到高维特征空间,则式(3)可以转化为

      $ \mathop {\min }\limits_{{{w}},b} \frac{1}{2}{\left\| {{w}} \right\|^2} + C\sum\limits_{i = 1}^l {{L_\tau }\left[ {1 - {y_i}\left( {{{{w}}^{\rm{T}}} \cdot \phi \left( {{x_i}} \right) + b} \right)} \right]} $

      通过引入松弛因子$\xi $,得到一个不等式约束条件下的凸二次优化问题

      $ \left. \begin{aligned} {\rm{}}& {\mathop {\min }\limits_{{{w}},b,\xi } }\quad {\frac{1}{2}{{\left\| {{w}} \right\|}^2} + C\sum\limits_{i = 1}^l {{\xi _i}} } \\ {\rm{}}& {{\rm{s}}{\rm{.t}}{\rm{.}}}\ {{y_i}\left( {{{{w}}^{\rm{T}}}\phi \left( {{x_i}} \right) + b} \right) \ge 1 - {\xi _{i,}}}\quad{ i = 1,2, ·\!·\!· ,l} \\ {\rm{}}& {\quad \;\;\,{y_i}\left( {{{{w}}^{\rm{T}}}\phi \left( {{x_i}} \right) + b} \right) \le 1 + \frac{1}{\tau }{\xi _{i,}}}\ {i = 1,2, ·\!·\!· ,l} \end{aligned} \!\right\}\quad\ \ $

      与C-SVM相比,Pin-SVM通过引入惩罚参数$\tau $,根据两类样本的最大分位数距离来确定分类超平面,降低了对分类决策面附近的噪声样本的敏感性,提高了重采样的稳定性,从而在保证较小的算法复杂度的同时,提高分类精度以及分类器的稳定性。

    • Pin-SVM与C-SVM都属于贝叶斯分类器,二者误分类率的上界相同,Pin-SVM的优势在于其对训练样本中包含的特征噪声不敏感。不失一般性地,考虑训练集为线性可分的情况,根据式(2)可得Pinball损失函数的次梯度${\rm{sgn} _\tau }\left( {x,y,f\left( x \right)} \right)$

      $ {\rm{sgn} _\tau }\left( {x,y,f\left( x \right)} \right) = \left\{ \begin{aligned} {\rm{}} & {1,}{\quad\quad\quad \, 1 - yf\left( x \right) > 0} \\ {\rm{}} & {\left[ { - \tau ,1} \right],}\quad {1 - yf\left( x \right) = 0} \\ {\rm{}}& { - \tau ,}\quad\quad\ \ \, { 1 - yf\left( x \right) < 0} \end{aligned} \right. $

      从而可以得到Pin-SVM的另一种表达形式

      $ {{0}} \in \frac{{{w}}}{C} - \sum\limits_{i = 1}^l {{{\rm{sgn} }_\tau }\left( {{x_i},{y_i},f\left( {{x_i}} \right)} \right){y_i}{x_i}} $

      其中,左侧的0表示当$1 - yf(x) = 0$时的特征向量。根据式(6)可以将整个训练集划分为以下3部分

      $\left. \begin{gathered} {{S}_{\rm{ + }}} = \left\{ {i:1 - {y_i}f\left( {{x_i}} \right) > 0} \right\} \\ {{S}_{\rm{ - }}} = \left\{ {i:1 - {y_i}f\left( {{x_i}} \right) < 0} \right\} \\ {{S}_{\rm{0}}} = \left\{ {i:1 - {y_i}f\left( {{x_i}} \right) = 0} \right\} \\ \end{gathered} \right\}$

      根据这3个被标记的集合,可以将式(7)转化为

      $ \frac{{{w}}}{C} - \sum\limits_{i \in {{{S}}_{\rm{ + }}}} {{y_i}{x_i}} - \sum\limits_{i \in {{{S}}_{\rm{0}}}} {{\rho _i}{y_i}{x_i}} + \tau \sum\limits_{i \in {{{S}}_{\rm{ - }}}} {{y_i}{x_i}} = 0 $

      其中,${\rho _i} \in \left[ { - \tau ,1} \right]$

      集合${S_ + }$${S_0}$中包含的训练样本个数少,即支持向量区域稀疏程度高是C-SVM对特征噪声以及重采样敏感的根本原因,特征噪声或重采样可能会直接地改变支持向量,进而对C-SVM的决策造成极大影响。从式(9)中可以看出,参数$\tau $可以控制${S_ + }$, ${S_0}$${S_ - }$ 3个集合中训练样本的数量。对比图2(a)图2(b)发现,随着超参数$\tau $的增大,${S_ + }$${S_0}$中样本数随之增大,Pin-SVM的支持向量的个数增多。这意味着Pin-SVM可以通过对超参数$\tau $的调整,寻找到一个相当稠密的支持向量区域,如图2(b)所示,数量较多的支持向量降低了噪声或重采样对决策造成剧烈影响的可能性。

      图  2  不同超参数$\tau $取值下Pin-SVM分类示意图

      Figure 2.  Schematic diagram of Pin-SVM classification with different hyperparameter $\tau $

    • 通过对极化SAR图像的极化特性与纹理特性进行分析,本文利用极化协方差矩阵多成分目标分解[24], H-A-$\bar \alpha $分解[25]以及灰度共生矩阵[26]方法分别提取常用的12种极化特征和纹理特征,并构成极化SAR图像分类的原始特征集

      $ \begin{align} \overrightarrow {{d}} =& \left[ {{P_{\rm{s}}},{P_{\rm{d}}},{P_{\rm{v}}},H,A,\bar \alpha ,{\rm{ENY,ENT,CON,}}}\right. \\ {\rm{}} & \left.\rm IDM,COR,SAV\right] \end{align} $

      其中,${P_{\rm{s}}}$, ${P_{\rm{d}}}$${P_{\rm{v}}}$为奇次散射功率、偶次散射功率和体散射功率,$H$, $A$$\bar \alpha $分别表示基于极化相干矩阵的特征值分解得到的极化散射熵、极化各向异性度和平均散射角,其余的6种特征表示的是基于灰度共生矩阵提取的纹理特征:能量${\rm{ENY}}$、熵${\rm{ENT}}$、对比度${\rm{CON}}$、反差矩${\rm{IDM}}$、相关度${\rm{COR}}$及和平均${\rm{SAV}}$

    • 在对特征向量进行训练之前,首先需要对特征向量中的每一种特征进行加权优化处理,以提高多种特征融合表达的效果。然而,如果采用人工分配的方法进行加权,工作量很大,而且很难保证分类结果的可信度,因此,本文采用归一化巴氏距离对特征向量进行加权处理。巴氏距离[27]描述的是某一特征对两类地物的可区分度,如果巴氏距离较大,则该特征可以很好的区分这两类地物,如果巴氏距离较小,则这两类地物在该特征中很难区分。巴氏距离$\left( {{\rm{BD}}} \right)$的表达式为

      $ {\rm{BD }}= \frac{1}{4}\frac{{{{\left( {{\mu _1} - {\mu _2}} \right)}^2}}}{{\sigma _1^2 + \sigma _2^2}} + \frac{1}{2}\lg \left( {\frac{{\sigma _1^2 + \sigma _2^2}}{{2{\sigma _1}{\sigma _2}}}} \right) $

      其中,${\mu _1}$${\mu _2}$分别表示对于同一种特征两类地物训练样本的均值,${\sigma _1}$${\sigma _2}$分别表示同一种特征两类地物训练样本的方差,通过对巴氏距离归一化处理可以得到每一种特征的权重,

      $ {p_i} = \frac{{{\rm{B}}{{\rm{D}}_i}}}{{\displaystyle\sum {{\rm{B}}{{\rm{D}}_i}} }} $

      其中,${p_i}$表示特征向量中的第$i$个特征对于区分这两类地物的权重,巴氏距离越大,权重越大。

    • 非参数模型的建模机理导致了超参数对支持向量机的泛化能力有很大影响。本文采用的核函数方法为高斯核函数,主要考虑对线性不可分的样本集合引入的误差惩罚参数$C$、高斯核参数${\sigma ^2}$和影响分位数距离的变量$\tau $对分类器的影响。

      使用网格搜索法与交叉验证法结合的方式进行超参数选择。首先利用网格搜索法确定各参数的选择范围:误差惩罚参数$C$${m_1}$种选择,高斯核参数${\sigma ^2}$${m_2}$种选择,参数$\tau $${m_3}$种选择,将3种参数交叉组合可以得到${m_1} \times {m_2} \times {m_3}$种组合方式。然后利用交叉验证法将全部训练样本分成10份,每次将训练样本集合中的1份样本作为训练集,其余9份样本作为测试集,重复10次上述过程,并根据平均分类精度的大小来选择最优的超参数组合。

    • 本文提出的分类算法的流程图如图3所示,算法具体的操作步骤如下:

      图  3  基于Pin-SVM的极化SAR图像分类流程

      Figure 3.  Flowchart of PolSAR classification based on Pin-SVM

      步骤1 使用精致LEE滤波[28]对原始极化SAR数据进行相干斑过滤;

      步骤2 将极化SAR图像的典型地物进行人工标注,并在每一类地物中随机抽取一部分样本构成训练集和测试集;

      步骤3 通过极化目标分解和灰度共生矩阵提取极化SAR图像的极化特征和纹理特征,构成目标的原始特征向量;

      步骤4 根据每一种特征的归一化巴氏距离,对原始特征向量进行加权处理得到融合后的特征向量;

      步骤5 在训练集上采用网格搜索与十折交叉验证结合的方法,在指定的参数范围内搜索Pin-SVM的最优超参数组合,训练得到Pin-SVM;

      步骤6 利用最终得到的Pin-SVM,在测试集上得到算法的分类精度,并对极化SAR图像进行全图分类。

    • 实验采用的数据是EMISAR在Foulum地区获取的L波段全极化协方差矩阵数据,该图像的大小为1100×750,空间分辨率为2 m×2 m,其光学图与Pauli分解的伪彩色RGB合成图分别如图4(a)图4(b)所示,该地区主要包括建筑物、森林、裸地以及豌豆、马铃薯、油菜、小麦等很多不同种类的农作物。通过大致比对光学图,把整幅图像划分为5类:建筑物、森林、裸地、细径作物和阔叶作物,选取的地物类别分布如图4(c)所示。

      图  4  Foulum地区EMISAR实验数据

      Figure 4.  EMISAR experimental datas of Foulum test site

    • 实验中从每类地物选取1200个像素进行人工标注,并从中随机取出100个样本作为训练集,其余样本作为测试集。本文选取高斯核函数,采用网格搜索与十折交叉验证法选择最优的参数组合C, ${\sigma ^2}$$\tau $,最后根据“一对一”多分类策略对EMISAR数据进行全图分类,Pin-SVM分类结果如图5(a)所示。可以看出,Pin-SVM对EMISAR图像的分类效果较好,左侧和右上角的森林区域用黄色很好地标注出来,右上角和右下角的“枫叶形”和“马蹄形”建筑区域的轮廓较为清晰,裸地也表现出清晰的纹理。两种农作物之间有少数像素误分,但整体上能够与森林和建筑物清晰划分。可以从两个角度分析,从极化特征的角度,因为森林和建筑物区域散射随机性较强,散射机理较为复杂,极化散射熵值较高,各向异性度值较小,而两种农作物散射机理较为单一,极化散射熵值较小,各向异性度值较高;从纹理特征的角度,农作物区域地形较为均匀,表现为粗纹理,而森林和建筑物区域地形复杂,表现为细纹理,因此两种作物区域的能量ENY和反差距IDM更大,熵ENT、对比度CON、和平均SAV更小。

      图  5  EMISAR图像分类结果对比

      Figure 5.  Classification results comparison of EMISAR image

      为了验证本文方法的有效性,采用C-SVM分类器、监督Wishart分类器、最小二乘支持向量机(Least Square SVM, LSSVM)以及基于Hinge损失的极限学习机(OPTimization based Extreme Learning Machine, OPTELM)实验作为对比模型,对实验数据进行了分类实验,分类结果分别如图5(b)图5(e)所示。通过图5(a)图5(e)对比,可以看出基于Pin-SVM和C-SVM分类器的分类结果图中各地物的纹理比较清晰,但是C-SVM分类结果中包含较多杂点,Pin-SVM的分类结果中杂点较少,特别是在森林区域,C-SVM会将很多森林区域的样本判定为建筑物,而Pin-SVM对建筑物与森林的分类结果更好。监督Wishart分类器仅仅采用极化相干矩阵进行分类,没有结合纹理特征和H,A,$\bar \alpha $,因此出现将不同地物之间的边界以及森林区域有很多误分为建筑物的现象。LSSVM分类器也同样出现杂点较多的问题,OPTELM分类器对各地物的划分效果都不太理想,尤其是建筑物与森林、细径作物与阔叶作物出现误分现象较为明显。

      表1为不同分类器对各地物测试样本的分类精度对比,分类精度=(分类算法正确分类的样本点个数)/(测试样本像素点个数),其中Pin-SVM, C-SVM,监督Wishart, LSSVM和OPTELM的整体分类精度分别为91.3%, 86.7%, 84.0%, 84.5%和84.0%。

      分类器地物类型整体精度
      建筑物森林裸地细径作物阔叶作物
      Pin-SVM94.390.795.182.394.191.3
      C-SVM91.080.692.380.189.786.7
      Wishart85.471.293.784.285.684.0
      LSSVM86.280.289.378.888.284.5
      OPTELM86.582.392.175.183.884.0

      表 1  不同分类器对测试样本的分类精度(%)

      Table 1.  Classification accuracy comparison of different classifiers

      图6展示了各地物分类精度的对比图,从图中可以看出Pin-SVM对各种类型地物的分类精度均高于C-SVM。综合全图分类实验的结果可知:相比于传统的C-SVM分类方法,基于Pin-SVM的分类算法对极化SAR图像中各类地物均具有更好的性能,整体分类精度也更高。由于二者使用完全一致的特征输入,而此特征数据中必然存在一定程度的噪声,较高的分类精度也能够侧面印证提出的算法具有一定的噪声鲁棒性。

      图  6  不同分类器对各地物分类精度的对比图

      Figure 6.  The comparison of the classification accuracy of different terrains

      在以上实验中,发现建筑物和森林比较容易混淆误分,其原因除潜在的噪声之外,两者也具有较多相似散射特性和较强散射能量。针对这一现象,采用建筑物区域和森林区域的标注样本分别进行C-SVM与Pin-SVM分类,将这两种分类方法得到的$yf\left( x \right)$的概率密度函数(Probability Density Function, PDF)进行对比分析,如图7所示。从图7中可以看出,两种分类器的概率密度函数都只有1个峰,因此从森林和建筑物提取的这两类离散的样本均仅含1个样本中心,不存在子类的情况。同时,Pin-SVM得到的$yf\left( x \right)$的PDF主要聚集在1附近,说明Pin-SVM在最小化误分类率的同时,也保证类内离散程度达到最小,从而使${L_\tau }\left( {1 - yf\left( x \right)} \right)$趋于0。而对于C-SVM, PDF主要在0.7左右聚集,即$yf\left( x \right) < 1$,此时${L_{{\rm{hinge}}}}\left( {1 - yf\left( x \right)} \right) > 0$,这说明对于建筑物和森林的分类,Pin-SVM的性能要优于C-SVM。

      图  7  分类器预测的概率密度函数对比

      Figure 7.  Comparison of probability density functions for the prediction of classifiers

    • 在对极化SAR图像进行分类时,往往是人为选定训练样本的采样范围。在采用C-SVM进行极化SAR图像分类时,通常会由于改变训练样本的采样区域导致分类结果出现较大变化,因此,针对重采样问题对线性的C-SVM和Pin-SVM进行实验与分析。实验中分别从森林和建筑物区域选取与之前实验中标定区域不同的900个样本作为训练样本的采样区域,测试则采用之前选取的1100个测试样本。实验方法是每次采样时从900个样本中随机抽取100个样本作为训练样本,训练得到最优分类决策面,根据分类决策面的变化对分类器的重采样鲁棒性进行评估。固定超参数C=20, $\tau \in {\rm{\{ }}0.1,0.2,0.5,1.0\} $表2展示了两种分类器对重采样的稳定性程度,其中重采样次数分别为30, 50, 100和150次。

      分类器重采样
      30次50次100次150次
      Pin-SVMw$8.96 \pm 1.11$$8.69 \pm 0.99$$8.57 \pm 0.96$$8.63 \pm 0.95$
      $\tau {\rm{ = }}1.0$b$ - 5.91 \pm 0.62$$ - 5.95 \pm 0.61$$ - 5.93 \pm 0.59$$ - 5.93 \pm 0.44$
      Pin-SVMw$9.43 \pm 1.23$$9.54 \pm 1.20$$9.42 \pm 1.15$$9.68 \pm 1.13$
      $\tau {\rm{ = 0}}{\rm{.5}}$b$ - 6.93 \pm 0.75$$ - 7.02 \pm 0.71$$ - 6.91 \pm 0.67$$ - 6.85 \pm 0.59$
      Pin-SVMw$11.43 \pm 1.63$$11.22 \pm 1.47$$11.09 \pm 1.46$$11.31 \pm 1.44$
      $\tau {\rm{ = 0}}{\rm{.2}}$b$ - 8.53 \pm 0.84$$ - 8.53 \pm 0.78$$ - 8.41 \pm 0.75$$ - 8.39 \pm 0.73$
      Pin-SVMw$12.30 \pm 1.84$$12.12 \pm 1.74$$12.23 \pm 1.61$$12.09 \pm 1.59$
      $\tau {\rm{ = 0}}{\rm{.1}}$b$ - 9.57 \pm 1.02$$ - 9.88 \pm 0.99$$ - 9.50 \pm 0.97$$ - 9.62 \pm 0.92$
      C-SVMw$13.29 \pm 1.96$$12.98 \pm 1.87$$13.42 \pm 1.73$$13.12 \pm 1.69$
      b$ - 16.15 \pm 3.04$$ - 15.81 \pm 2.74$$ - 15.92 \pm 2.45$$ - 15.48 \pm 2.28$

      表 2  重采样实验结果

      Table 2.  Experimental results of the resampling

      图8给出了法向量w和偏置b稳定性的对比,从中可以看出,重采样后C-SVM的法向量w和偏置b的标准差都大于Pin-SVM,相比C-SVM, Pin-SVM对于重采样具有更好的鲁棒性。

      图  8  重采样的鲁棒性评估

      Figure 8.  Robustness evaluation of resampling

    • 由于Pin-SVM的分类性能受到超参数包括误差惩罚参数$C$、高斯核参数${\sigma ^2}$和参数$\tau $的影响,因此通过实验对3种参数取值对分类算法的影响进行详细讨论。实验中固定其中1个超参数,探究另外2个超参数变化的情况下算法精度的变化情况,误差惩罚参数$C$的选择范围为$\left\{ {{2^i}|i = - 2, - 1,0,1,2,3} \right\}$,高斯核参数${\sigma ^2}$的选择范围为$\left\{ {{2^i}|i = - 1,0,1,2,3} \right\}$, $\tau $的选择范围是$\left\{ {{\rm{0}}{\rm{.1,0}}{\rm{.3,0}}{\rm{.5,0}}{\rm{.7}},{\rm{0}}{\rm{.9}}} \right\}$。固定其中1个参数,Pin-SVM分类精度受另外2个参数影响如图9所示。

      图  9  Pin-SVM的参数对分类精度的影响

      Figure 9.  The effect hyperparameters of Pin-SVM on classification accuracy

      图9可以看出:随着惩罚参数$C$的增大,算法的分类精度逐渐提高;随着高斯核参数${\sigma ^2}$的减小,分类精度整体呈上升的趋势;随着参数$\tau $的逐渐增大,分类精度呈先减小后增大的趋势。故在参数选择时应尽量选取较大的惩罚参数$C$和较小的高斯核参数${\sigma ^2}$,参数$\tau $的取值应该结合具体应用综合衡量。

    • 支持向量机在小样本情况下表现出了良好的学习能力和泛化能力,在极化SAR图像分类中应用广泛。但是极化SAR图像中的噪声会传递至图像特征以影响C-SVM的分类精度,同时标定样本的随机性会影响C-SVM的分类决策面的稳定性,这两点均不利于实际应用。本文基于Pin-SVM提出一种极化SAR图像地物分类的新方法,以提高对特征噪声和重采样的鲁棒性。通过Foulum地区EMISAR数据对提出算法的分类精度、重采样稳定性、噪声不敏感性和类内离散程度等方面进行实验分析,结果表明本文算法相对于传统方法具有更好的地物分类效果,对噪声和重采样有更强的鲁棒性。

参考文献 (28)

目录

    /

    返回文章
    返回