推动国内外学术交流 助力科研成果推广

期刊论文、出版出书、评职称学术咨询

社会认可、全国通用、升职加薪的通行证

基于聚类深度网络模型的莱州湾近岸平原表层土壤有机质含量遥感估算

来源:SCI期刊网 分类:农业论文 时间:2021-10-19 08:05 热度:

摘 要:摘要:准确掌握土壤有机质(SOM)含量特征及分布状态是土地肥力管理和陆地生态环境保护的关键。选取莱州湾近岸平原为研究区,采集348个土壤样点并获取同期Sentinel-2多光谱影像,利用

  摘要:准确掌握土壤有机质(SOM)含量特征及分布状态是土地肥力管理和陆地生态环境保护的关键。选取莱州湾近岸平原为研究区,采集348个土壤样点并获取同期Sentinel-2多光谱影像,利用变量重要度投影算法提取SOM的敏感光谱特征作为自变量,测定的SOM含量值为因变量,进一步将空间聚类模块引入深度神经网络学习法构建聚类深度网络遥感估算模型,最终完成SOM的含量估算与区域尺度上的数字制图。结果表明:(1)在土地盐碱化作用下,近红外范围内波段对SOM的光谱响应最强,波段8的重要度值最高,采用波段差值运算能够综合两波段光谱信息突出SOM的吸收信号。(2)聚类深度神经网络模型的反演精度R2和RMSE达到0.82和2.25,相对比深度神经网络模型准确度分别提升36.67%和52.23%,在引入空间聚类函数后使模型过拟合问题缓解和计算效率提升。(3)SOM含量的高值热点和低值冷点区域在空间上呈现带块状分布的趋势,田块尺度上SOM分异规律明显,受到海水倒灌和微地貌的共同影响。研究采用的聚类深度神经网络模型可为利用多光谱遥感数据反演SOM和进行区域尺度上的土壤质量精细监测及管理提供有效的技术支持。

基于聚类深度网络模型的莱州湾近岸平原表层土壤有机质含量遥感估算

  关键词:环境学;土壤有机质;遥感估算;聚类深度网络;莱州湾近岸平原

  土壤是地表生命活动正常进行的基础和媒介,维持着陆地生态系统的平衡稳定[1-3]。有机质(SoilOrganicMatter,SOM)是土壤的重要组成部分,决定着土壤的持水保肥能力,影响着土壤微生物的活性数量,与作物的长势产量密切相关,在全球碳循环中起到重要的沉积转化作用[4-5]。SOM的含量高低受母质、地形、气候和人类活动等诸多因素作用,要素间存在的差异和波动导致了SOM在不同景观格局中呈现出独特的空间结构。在现代土地资源管理和精准农业建设中,开展土壤有机质的含量特征和分布状况研究对于土地优化管理和环境监测具有重要意义。

  传统上,SOM的空间分异规律监测依赖于高密度的采样和实验室化学分析,虽可获得高精度结果但消耗大量财力物力。随着现代遥感信息技术的发展,Krishnan等[6]在1980年首次采用光谱计量学技术确定了SOM与光谱反射率间的反比关系,建立起特征光谱波段与土壤有机质的多元回归模型,无损高效地完成了SOM含量预测。Peng等[7]也进一步利用550nm~810nm范围内的光谱波段进行SOM建模估算,取得较好精度。土壤是多环境因子相互作用下发育而成的复杂的综合体,所表现出的关系大多都是非线性的,因此基于机器学习技术的估算模型应用至土壤属性的反演制图中更为高效。吴嵩[8]、Hong等[9]和刘焕军等[10-11]构建机器学习技术支持下的BP、SVM、ELM和RF等多种土壤遥感反演模型,进一步提高了土壤属性预测精度和制图稳定性。深度学习技术通过增加隐藏层数和对土壤属性数据的多重非线性映射,使各网络层的联结和信息回馈能力增强,能够更好的模拟地表反射率的传递过程和解决传统神经网络的局部最优点问题[12]。但是模型在拟合过程需要大量的训练样本和复杂的图像计算,否则会带来过拟合和模型性能不足的问题,这也是限制其在土壤科学领域广泛应用的重要原因。地理学第一定律[13]表明,距离越近的地物之间相关性越强,而特异性地理数据表现出弱空间自相关性并且在区域空间上呈现出非关联性,这种空间特异性增加和遮蔽了SOM与特征光谱的潜在映射关系,因此需要加入大量样本去训练模拟真实地表过程,学习过程中自由参数数量增加,提升了反演建模难度。陈奕云等[14]、肖云飞等[15]、邬登巍等[16]和Bao等[17]采用随机抽取、含量特征、光谱特征、土壤类型和含量空间欧式距离等方法进行训练样本选择,减少母质、采样方式和人类活动产生的变异特征对其影响,在保证验证集精度的前提下有效的提升训练精度。但是在考虑样本含量的统计变异的特征参数以外,地理数据还带有显著的空间位置特征的属性信息。因此,在传统的深度神经网络学习法[18]中增加空间聚类函数模块构建聚类深度网络模型。模型可以通过空间聚类函数将地理数据的空间信息进行引入,探测在连续地理空间上SOM样本的空间关联性并进行输入数据集的最优聚类,降低空间特异数据的影响并减少样本量,提高模型对SOM的估算和预测制图能力。空间聚类函数是以空间权重矩阵为基础,用来阐述土壤数据在各个样本位置上的空间关系并赋予权值,可以识别出空间特异数据和进行聚类[19-20]。深度神经网络模型是深度学习算法的一种,属人工智能范畴,能够更加真实的反映出土壤与电磁反射率系统中的高度复杂映射关系,在解决多源数据的未知变量分类和预测上具有更强灵活性[18]。因而,在统计分析模型中顾及地理空间信息在土壤属性估算和数字制图应用中具有一定的潜力。

  莱州湾西南部近岸平原处在海洋与陆地交接地带,在海咸水倒灌作用下土壤表现出轻微盐碱化,区域内的SOM含量产生明显的空间变异。李勇志等[21]和徐夕博等[22]利用实测高光谱数据在莱州湾近岸平原初步建立SOM在局地尺度上的光谱估算模型,但是模型在扩展至区域尺度上进行SOM的监测制图仍存有局限。所以,在此特定景观环境下构建准确高效的SOM估算模型一直是土壤遥感领域的重点和难点工作,因此将莱州湾西南近岸平原选为研究区。首先,采集348个土壤样本并获取相近时相的Sentinel-2多光谱影像,构建两波段差值、比值、归一值指数和单波段共210个光谱特征参量。进一步采用变量重要度投影算法(VariableImportanceinProjection,VIP)探寻SOM的光谱响应区间和敏感波段指数作为输入自变量,测试得到SOM含量为因变量。最后建立基于深度神经网络算法和聚类深度神经网络算法的SOM估算模型并完成区域的反演制图,以期为实现土地资源的监测管理提供理论依据和技术支撑。

  1.材料与方法

  1.1研究区概况

  研究区位于莱州湾西南岸山东寿光市境内,地理坐标介于37°11′N~37°6′N,118°44′E~118°53′E范围内,占地面积约为87.3km2。研究内气候类型主要为暖温带季风大陆性气候,夏季炎热多雨,冬季寒冷干燥,多年平均降雨量和气温分别为608.5mm和12.7℃。全区地形以平原为主,土质肥沃,农作物种植以小麦、玉米和棉花为主。在地势构造上隶属辽冀台向斜沉积层,土壤类型主要为盐化潮土。土地利用上除少量农村建设用地以外,其余均为农田。境内海陆运交通便利,因距海较近受潜埋咸水入侵影响,区域内土壤存在一定程度的轻微盐渍化[23]。

  1.2土壤样点采集与测试

  以ArcGIS10.2软件数字底图为基础,结合实地调查、土地利用类型、土壤类型和水文地质状况,完成348处土壤样点的布设(图1)。采样过程中,在预设采样点周边以10m为半径的范围内采用多点混合法将表层土壤(0~20cm)混合至1kg左右,确保样品能够在此地理空间内具有典型代表性,随后装入聚乙烯密封袋中送往实验室待测。采样同时,利用手持GPS确定采样点的真实地理坐标,并进行记录。土壤样品的采集在2019年1月2日至1月8日期间完成,此时研究区内主要为裸土和少量植被覆盖,参照高永刚等[24]和Davis等[25]对裸土的归一化植被指数(NDVI)取值范围划分,NDVI小于0.2时可以视为裸土并据此将植被覆盖区域去除。实验室内,首先将土壤样品中的木棒、石块和草根等异质物体剔除,放置在自然条件下室内进行风干、研磨和过筛(1mm),然后参照多目标地球化学样品测试质量规范,将预处理后的土壤样品使用重铬酸钾法进行土壤有机碳含量测试,最后利用有机碳的1.724的换算系数得到SOM的含量值[26]。

  1.3遥感影像数据及预处理

  Sentinel-2/B是由欧空局在2017年发射的一颗对地环境监测与灾害支援卫星,Sentinel-2/B卫星与2015年发射的A星组网后,在天气良好状态可实现全球5天一次的全覆盖,在赤道地区提高至2到3天的一次重访[27]。卫星搭载的多光谱传感器MSI包含13个有效波段,按照空间分辨率进行分类,可分为:10m(波段2、波段3、波段4和波段8)、20m(波段5、波段6、波段7、波段8a、波段11和波段12)和60m(波段1、波段9和波段10)。

  在地面没有积雪覆盖且晴朗无云的天气状态下,免费下载2019年1月17日生成的Sentinel-2/B卫星影像数据一期(美国地质调查局网站,https://glovis.usgs.gov)。获取得到原始L1C级的影像数据产品转换为地表真实反射率的L2A级数据,主要操作包括辐射校正和大气校正,使用欧空局推荐的SNAP软件(包含Sen2Cor插件)完成[28]。波段10主要参与大气特征的探测,并不能够反映SOM的反射率特征,因此不参与接下来的遥感反演计算。校正过程中所有波段均进行10m空间分辨率的重采样,像元与地面真实采样点间进行地理配准,确保配准偏差小于0.5像元。此外,尽管影像生成时间与地面采样在时相上存在数天的差异,但耕地中SOM的处于稳定状态其含量的变化是极其缓慢的过程,且影像生成和采样时的前后三天内均无明显降水,排除了土壤的水分信息对反射光谱的影响,故卫星影像与地面采样可以视为等同时相[29-31]。

  1.6精度评估

  采集到的土壤样本集(n=348)按9:1比例随机分为建模集(n=313)和验证集(n=35)两部分。选择决定系数(CoefficientofDetermination,R2)和均方根误差(RootMeanSquareError,RMSE)作为衡量模型估算效果的指标。R2主要用于评价自变量解释因变量信息大小的能力,RMSE评估反演模型估算值与实测值之间的误差大小,R2和RMSE的计算过程和公式参见文献[41]。通常在模型评价中,R2越大的同时RMSE越小,模型的性能和精度越高。

  2.结果与分析

  2.1SOM含量描述性统计分析

  土壤有机质质量比的描述性统计特征如表1所示,样品总集的SOM质量比范围处在2.34g/kg至60.06g/kg区间内,覆盖范围较大且不均匀。参照国家土壤养分普查的等级分类标准,样品总集SOM质量比多处在第四级(10~20g/kg)和第五级(6~10g/kg)内,SOM中值为12.18g/kg,SOM质量比整体处于低水平上。变异系数用来评估数据的波动程度,三个数据集的变异系数均大于0.36,处于高度变异[42],表明区域内存在较多SOM异常值。数据的空间变异会增加地表过程模型的训练难度,但是一定程度的数据变异性会对模型准确度提升产生积极影响[41],所以随机抽取到的建模集和验证集用于SOM的遥感建模估算是可靠的。峰度和偏度用于描述数据分布的集中和双尾特性,三个集合的偏度值均大于0,表现出正偏,表明外部活动已经干扰了成土之初SOM正态分布状态。验证集上的峰度值出现负值,说明SOM在验证集的质量比分布区别于正态分布,呈现出非集中的均匀分布态势。SOM质量比统计特征的变异性一定程度上也反映了土壤退化的趋势和状态。莱州湾南岸地区有大量海咸水赋存在浅层地表,地下水过度开采和旱季蒸发强烈致使土壤盐分在表层结晶聚集,土壤肥力下降随之带来一系列的土地环境退化问题,也是不同集合的SOM数据分布存在偏移的潜在驱动因素[43]。

  2.2最优光谱特征

  12个单波段和计算得到的66个D指数、66个R指数和66个N指数的VIP重要度值如图3所示。图3d可以看出,近红外范围波段(B7至B12)是SOM响应的敏感区间,B8是重要度值最高的单波段,差值光谱特征指数对SOM的响应敏感性高于比值和归一化波段指数。单波段中重要度值次高的是在近红外范围内的B8a波段,B8和B8a波段较窄,具有相互替代的作用,因此二者的重要度最高并且基本一致。重要度其次的在近红外光范围内的是B7、B9、B11和B12,四个波段的中心波长分别在780、943、1610和2186mm。B6(中心波长在740nm)是可见光范围内SOM的重要度最高的特征波段,反射率特征与土壤中腐殖质和氧化铁相关[44]。其余波段的VIP重要度值小于1,对SOM含量的响应并不敏感。

  基于不同波段变换形式的光谱特征指数的VIP值差异明显,波段比值和归一值变换后光谱指数的VIP值变小,而差值指数的VIP值增强显著。在差值光谱特征指数热图中(图3a)存在两个区域内光谱指数重要度显著高于其他区域,分别是B7和B8在B1至B4范围内,及B11在B7至B8a范围内,共11个D光谱指数。B1至B5在单波段中重要度值最低,而经过波段差值操作后构建的光谱指数对SOM的响应能力明显增强,这说明双波段构成的综合光谱特征指数能够有效增强SOM的弱吸收信息,同时减弱噪音。输入训练模型的光谱特征除需要考虑VIP重要度值大小以外,还需要顾及深度神经网络模型的隐藏层数及节点数目,因此将VIP值大于2.75的光谱特征指数选择为模型输入自变量,具体为B8-B11、B2-B7、B1-B7、B4-B8、B3-B7和B4-B6。

  2.3估算模型对比及SOM含量空间分布

  优选得到的光谱特征参量作为输入自变量,SOM含量值为因变量,分别建立深度神经网络和聚类深度神经网络估算模型,训练得到的模型在验证集估算效果如图4所示。深度神经网络模型(R2=0.60和RMSE=4.71)的估算值和实测值基本保持在1:1线附近(图4a),具备一定的估算能力,但SOM在估算过程中出现高估和低估误差,偏离点较多。聚类深度神经网络模型在t值为1时聚类获得的输入数据集(n=283个)空间集聚性最优,模型取得的R2和RMSE分别为0.82和2.25,相对原始深度神经网络模型R2上升了36.67%,RMSE下降了52.23%,反演效果散点图如图5b所示。SOM数据估算值和实测值在标准1:1线的两侧,偏差较小,估算效果最佳。

  为进一步验证模型的稳定性和可靠性,将所得的最优聚类深度神经网络模型应用至研究区(已掩膜建设用地、河流和道路等非裸土区域),得到莱州湾近岸平原的SOM含量空间分布(图5)。整体上,SOM含量呈现块带状分布,高值区域和低值区域在田块尺度上分异明显,西南和东北部有机质含量相对较高,而中部和南部存在有较多低含量值的地块。模型对研究区SOM估算值处在2.57g/kg至23.88g/kg范围内,采样点实测SOM质量比在6g/kg至20g/kg之间集中分布(表1),二者的数据分布特征基本能够相互对应。虽然在人为和环境因素共同影响下,模型对极大值点(60.06g/kg)拟合的时候存在一定局限,但所得结果仍能够较好的反映出研究区的SOM的分布趋势。

  研究区内SOM的含量分布主要受到海水入侵、微地貌和耕作方式的影响。莱州湾近岸平原虽处沿海地区,但大陆性气候在旱季表现出降水少且蒸发大的特点,加之区域浅层地下海咸水存量丰富,地表蒸发结晶析出后在土壤表层聚集,造成部分田块发生土地退化导致相应的SOM含量不断降低。羊口地区在耕作方式上提出精播和后施肥策略,在具体落实上多以村庄为实施单元,不同的实施进程和作物种植类型导致不同村庄所属的耕地抑盐效果存在部分差异,土地肥力水平发生变化,故而也导致西南、东北部土壤有机质含量高,西北和东南部土壤有机质含量低。另一方面,受复杂的环境气候因素影响,SOM表现出空间分异趋势并不显著,但是在田块尺度上的SOM变化规律十分明显,可在农户视角上为土地精准施肥和田间精细管理提供技术支撑和依据。

  3.讨论

  SOM的光谱特征构建和选取是聚类深度神经网络估算模型建立的重要基础。除将影像的12个多光谱波段作为自变量输入以外,利用线性数学变换(差值、比值、归一值、正切角和弓曲率等)得到的光谱特征指数能够有效的增强影像信息,所形成两波段光谱特征指数能够综合邻近波段间的光谱信息,突出SOM的反射率吸收特征和弱化无关光谱信号[45]。另一方面,基于相同波段反射率计算得到的光谱特征指数从一维上升至二维会带来光谱信息重复和冗余。因此,结合相关文献的研究,仅选取两波段差值、比值和归一值三种变换方式挖掘SOM的光谱特征信息。由图3中可以得出,基于不同数学形式的波段变换指数对SOM的光谱敏感性存在一定差异。差值光谱特征指数对SOM的响应敏感性高于比值和归一化波段指数。Hong等[9]、刘焕军等[5]和郭燕等[46]在对D、R和N等光谱指数对SOM的关联度定量评价中,发现相关性大小的确在不同波段变换形式下存在一定差异,与土壤中水分和粘土等矿物组分干扰有关。莱州湾近岸平原处在海陆交接地带,土壤兼具海洋和陆地的环境特性,因而差值光谱特征指数在此区域用于SOM光谱信号捕捉更为有效。近红外范围波段(B7至B12)是SOM响应的敏感区间,B8是重要度值最高的单波段。陈德宝等[47]、林楠等[48]和Rossel等[49]在对SOM的光谱响应波段分析时也发现,近红外范围内具有特定的SOM响应特征波段,光谱反射率受到C-H振动、高岭土和Al-OH粘土矿物的影响。徐夕博等[22]在对莱州湾近岸平原土壤的地面实测高光谱进行分析时,指出在波长范围在700nm~900nm间光谱波段对SOM的响应能力最强,同时哨兵影像B8的光谱范围处在785nm~900nm之间,证实了所得光谱特征的有效性。刘焕军等[10]和马驰等[50]同样采用Sentinel影像反演黑土耕地SOM含量时却发现可见光范围内的波段3和波段6的重要度最高。王琪等[51]在利用Landsat-8多光谱数据对青藏高原高寒地区SOM遥感估算时得出短波红外范围内存在SOM的典型特征波段。Silvero等[52]在对巴西南部农田区域的SOM的Sentinel-2波段关联度定量分析时也得出近红外光谱范围内的光谱波段对SOM响应最为强烈,同时土壤的颜色呈现出黄-棕色且整体SOM处于较低等级(均值<20g/kg,第四级)。世界各地区的土壤对Sentinel-2特征波段的响应范围存在一定差异,Gholizadeh等[53]在进一步利用Sentinel-2卫星多光谱波段对SOM建模估算贡献分析时发现,通常黑色土壤粘土含量丰富所能赋存SOM含量高时,应需要重点考虑土壤颜色和质地对可见光范围光谱特征波段的影响。莱州湾近岸平原地区受海咸水入侵影响,土壤出现轻微盐碱化SOM含量等级较低颜色变浅,盐化矿物(O-H键)活动增强。因此,近红外范围内的波段成为SOM的主要响应特征。

  聚类深度神经网络遥感估算模型的建立考虑了区域土壤环境中存在的空间特异性。传统深度神经网络模型在SOM的遥感反演中通过改变网络的深度和宽度达到最优化模拟地表反射率传递过程,有效的提升了精度和减弱了传统神经网络的局部最优点问题。但通常模型假定样本在空间之内是独立存在的,不能通过空间关联性对异质数据进行判断,使模型出现过拟合和样本数目需求量大的问题[54]。莱州湾南近岸平原地区SOM含量在时间和空间维度上存在较大变异,土壤属性与反射率间在不同区域上存在着复杂的对应关系,在反演模型构建前需考虑不同区域单元内的标签值与特征值映射关系差异。获取足够多的土壤样点可以分析得到反射光谱传输在各区域单元内的响应差异,但是样点的采集测试过程需花费大量的财力物力。因此,聚类深度神经网络模型纳入空间聚类函数模块以评估SOM数据样本的空间异质性和关联性,以此确定训练样本集的权重和最佳组合,得到具有相对稳态的数据集群。使聚类深度神经网络模型减少了大量节点函数的传递计算,求解稳定网络结构得到简化,避免出现过拟合问题,运算效率提升。在模型的运算过程中,t值意味随机性的强弱和数据集聚程度,数值越小,数据关联性越强,聚类产生的数据集空间特异程度越小。图6为模型拟合过程中,不同t值下的聚类产生训练数据集。在t值小于4共有310个样点进入深度神经网络模型计算,训练精度R2为0.62。随着t值的减小,空间随机性限制严格,样本点数逐步减少。在283个样本时(t=1),训练集合的精度达到最高0.82,为最优数据聚类。其后由于样本点的继续减少,模型不能够完全训练,精度开始下降。总体来说,聚类深度神经网络模型中通过增加空间聚类函数引入了地理空间信息,提高了模型精度和稳定性,缓解过拟合得到缓解,但同时获取采集一定数量的区域代表性的训练样本也是保证聚类深度神经网络模型充分训练达到目标的必要条件。

  聚类深度神经网络模型实现了SOM的遥感估算和分异规律监测,取得数字制图成果能够为土壤肥力评估和生态环境监测提供支持。与传统BP神经网络相比,聚类深度神经网络模型全连接层间联结反馈能力增强,对高度复杂的地表电磁反射传输过程的函数拟合更为真实和稳定。莱州湾近岸平原距海较近,表现出独特的介于陆地与海洋间的土壤特性,SOM也与多种环境因素交互作用(植被、水分、海洋、地形和母质)。徐夕博等[22]和李勇志等[21]在莱州湾南岸近海平原建立的SOM遥感估算模型,在局地尺度上进行SOM估算的精度指标R2在0.64~0.80之间,而本研究建立的聚类深度神经网络模型精度指标R2达到0.82,并且已从局地尺度上的光谱估算拓展到区域尺度上SOM监测制图。遥感反演中仅强调瞬时的光学特征是远远不够的,需要将SOM的动态过程及环境光谱响应综合考虑进去,才能使模型的通用性和稳定性更强。其次,反演模型训练时选取的最优光谱特征指数作为输入自变量,纳入计算的光谱特征指数对SOM的响应强度是存在一定差异的,但在模型训练时并未进行体现。在聚类深度神经网络模型中若能考虑各光谱特征指数权重,将有助于确定准确合适的神经元节点和隐藏层数目,提升模型精度和运算效率。最后,遥感反演中的混合像元干扰仍是无法回避的问题,混合像元表现出的光谱反射率实际上会弱化目标物质的光谱特征。研究所选用的较高空间分辨率(10m)的Sentinel-2作为影像数据源,并且掩膜掉道路、植被和建设用地等非裸土区域,弱化混合像元的干扰,王飞等[55]和Allbed等[56]提出采用线性混合像元分解模型及采用更高空间分辨率的影像提升遥感估算精度,在下一步研究中需参考改进。——论文作者:冯泉霖1,李洪涛1,徐夕博2,3*,翟晓燕3,王泽强31

  相关期刊推荐:《安全与环境学报》(双月刊)2001年创刊,是安全与环境学科的学术性双月刊,主要刊载石油、化工、生态、环境、矿业、信息、网络、冶金、建筑、交通、勘探、国防等领域的相关论文。本刊的办刊宗旨:交流安全与环境方面研究的成果,发展安全与环境科学技术,培育安全与环境科研队伍,为中国和全球的工业安全和环境保护服务。

文章名称:基于聚类深度网络模型的莱州湾近岸平原表层土壤有机质含量遥感估算

文章地址:http://www.sciqk.com/lwfw/nylw/12032.html

基于聚类深度网络模型的莱州湾近岸平原表层土壤有机质含量遥感估算相关文章:

相关期刊推荐:

服务人群

各类科技、学术领域等高知人群和亟需科研成果推广与转化项目的企业及机构。

我们的愿景

做科研工作者身边的学术顾问,让优秀的学术成果走出去,把先进的科学技术引进来!

专业的学科咨询老师

世界范围内主流中、英文期刊审稿人,近百名对应学科的专业咨询团队

符合学术规范的高效服务

拥有研究生以上学历且具有丰富科研经历的学术人员,经过严格测试和评估合格后为您提供专业的学术咨询服务。