題目
基于無(wú)人機(jī)高光譜遙感的粳稻冠層葉綠素含量反演研究
應(yīng)用關(guān)鍵詞
葉綠素含量;無(wú)人機(jī)高光譜;農(nóng)業(yè)應(yīng)用
背景
葉綠素含量是表征粳稻生長(zhǎng)狀況的重要指標(biāo)。開(kāi)發(fā)近地尺度的快速評(píng)估粳稻葉綠素含量的無(wú)人機(jī)高光譜遙感平臺(tái),對(duì)輔助田間精準(zhǔn)施肥和農(nóng)藥施用具有重要現(xiàn)實(shí)意義。
目前,利用高光譜數(shù)據(jù)反演作物葉綠素的研究多采用統(tǒng)計(jì)回歸模型,大致可分為兩類(lèi):植被指數(shù)模型和直接光譜模型。在植被指數(shù)模型中,首先利用高光譜數(shù)據(jù)構(gòu)建各種植被指數(shù),然后利用這些指數(shù)構(gòu)建多元線(xiàn)性或非線(xiàn)性回歸方法,建立這些指數(shù)與葉綠素含量之間的反演模型。這種方法的優(yōu)點(diǎn)是模型構(gòu)造簡(jiǎn)單,物理意義明確。然而,它需要以特別的方式構(gòu)建大量的光譜指數(shù),沒(méi)有對(duì)一般作物品種的系統(tǒng)指導(dǎo)。不同的光譜指數(shù)取決于特定物種的類(lèi)型和區(qū)域,因此缺乏普遍適用性。直接光譜模型依賴(lài)于整個(gè)高光譜波段,通常是一個(gè)高維矢量。直接利用整個(gè)高光譜波段會(huì)導(dǎo)致模型復(fù)雜度高,甚至模型過(guò)擬合。這個(gè)問(wèn)題可以通過(guò)采用降維技術(shù),如主成分分析或偏最小二乘回歸來(lái)解決。
上述現(xiàn)有研究的高光譜數(shù)據(jù)大多是在地面或低空采集的。因此,測(cè)量的覆蓋面積非常小。本研究的無(wú)人機(jī)平臺(tái)可以在更高的高度操作,從而實(shí)現(xiàn)高效的大規(guī)模數(shù)據(jù)收集。具體來(lái)說(shuō),該系統(tǒng)工作在150 m的高度,可以在15秒內(nèi)獲得1000 m2區(qū)域的高光譜圖像。此外,文獻(xiàn)中的許多現(xiàn)有方法都是利用傳統(tǒng)的回歸方法開(kāi)發(fā)的,其中許多模型參數(shù)是根據(jù)過(guò)去的經(jīng)驗(yàn)進(jìn)行初始化。本研究采用數(shù)據(jù)驅(qū)動(dòng)的方法,通過(guò)采集的數(shù)據(jù)進(jìn)行模型參數(shù)優(yōu)化。數(shù)據(jù)驅(qū)動(dòng)的方法可以消除人為偏見(jiàn),獲得更準(zhǔn)確的預(yù)測(cè)結(jié)果。
本研究的目的是利用無(wú)人機(jī)遙感平臺(tái)采集的高光譜成像數(shù)據(jù),建立預(yù)測(cè)粳稻冠層葉綠素含量的反演模型。我們首先采用連續(xù)投影算法(Successive projection algorithm, SPA)從高光譜數(shù)據(jù)中提取特征波段。以提取的特征作為輸入,利用極限學(xué)習(xí)機(jī)(Extreme learning machine, ELM)建立反演模型。采用粒子群算法(Particle swarm optimization, PSO)對(duì)ELM的種群大小、慣性權(quán)重、學(xué)習(xí)因子、速度位置相關(guān)系數(shù)等參數(shù)進(jìn)行了優(yōu)化。最終構(gòu)建基于PSO-ELM算法的葉綠素含量高精度估測(cè)模型。
試驗(yàn)設(shè)計(jì)
試驗(yàn)地點(diǎn)位于遼中卡力瑪水稻實(shí)驗(yàn)站,設(shè)有4個(gè)水稻氮肥梯度處理。沈陽(yáng)農(nóng)業(yè)大學(xué)許童羽教授團(tuán)隊(duì)利用搭載有GaiaSky-mini2-VN高光譜相機(jī)(江蘇雙利合譜公司)的DJI M600無(wú)人機(jī)平臺(tái)(圖1),于粳稻分蘗、拔節(jié)、孕穗、抽穗、開(kāi)花和灌漿期共6個(gè)關(guān)鍵生育期獲取其冠層高光譜影像。高光譜傳感器的波段范圍為400 ~ 1000 nm,光譜分辨率為2.35 nm。去除光譜上下邊界的兩個(gè)波段,最終得到253個(gè)有效波段。
圖1 無(wú)人機(jī)高光譜成像系統(tǒng)
本研究使用常見(jiàn)的連續(xù)投影算法SPA用于波段的選擇。本研究選擇的光譜范圍為400 ~ 800 nm,這是由于水稻葉綠素含量的變化主要影響該范圍內(nèi)的光譜反射率。SPA的輸出為波段的集合。為了進(jìn)一步減少波段數(shù)量,對(duì)所有輸出子集應(yīng)用多元線(xiàn)性回歸MLR模型,選擇產(chǎn)生最小均方根誤差RMSE的子集作為最終的優(yōu)選高光譜波段。
ELM是一種具有單層或多層隱層的前饋神經(jīng)網(wǎng)絡(luò)。與傳統(tǒng)的反向傳播(BP)神經(jīng)網(wǎng)絡(luò)不同,ELM隱層節(jié)點(diǎn)的參數(shù)是隨機(jī)分配的,而且永遠(yuǎn)不會(huì)調(diào)整。與傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)相比,ELM的一個(gè)主要優(yōu)點(diǎn)是學(xué)習(xí)速度更快。然而,由于隱層節(jié)點(diǎn)參數(shù)的隨機(jī)性,在許多實(shí)際應(yīng)用中,通常需要大量的隱層節(jié)點(diǎn)才能達(dá)到預(yù)期的精度。此外,傳統(tǒng)的ELM架構(gòu)有時(shí)沒(méi)有很好的泛化能力。為了解決上述問(wèn)題,我們提出采用粒子群限制學(xué)習(xí)機(jī)算法,即結(jié)合粒子群算法(PSO)和ELM。利用帶有粒子群優(yōu)化的ELM模擬了葉綠素含量與高光譜特征之間的關(guān)系。采用PSO對(duì)ELM的輸入層權(quán)值和隱層偏差進(jìn)行優(yōu)化選擇,計(jì)算輸出權(quán)重矩陣。本研究所考慮的粒子群算法參數(shù)主要包括群體大?。╬op)、慣性權(quán)重(w)、學(xué)習(xí)因子(C1, C2)和速度位置相關(guān)系數(shù)(m)。本文利用均方根誤差(RMSE)和決定系數(shù)(R2)對(duì)反演模型的精度進(jìn)行評(píng)價(jià)。
結(jié)論
首先,研究了粳稻葉綠素含量與不同高光譜波段的相關(guān)性。采用皮爾遜相關(guān)系數(shù)、距離相關(guān)系數(shù)和最大信息系數(shù)(Maximum information coefficient, MIC)三種方法分析了葉綠素與各個(gè)波段的相關(guān)性(圖1)。這三種方法的結(jié)果總體上有相似的趨勢(shì):葉綠素含量與高光譜反射率之間的最大相關(guān)性在波長(zhǎng)范圍701 ~ 705 nm之間。具體而言,三種方法的相關(guān)系數(shù)峰分別為0.66、0.64和0.53。除了最大相關(guān)波段之外,在其他波段,如波長(zhǎng)在410 ~ 480 nm之間的波段,也觀察到相對(duì)較強(qiáng)的相關(guān)性。雖然400至450 nm的反射率低于0.1,但所有波段的信噪比在6.0至15.9 dB之間,可以提取特征的響應(yīng)信息。
研究中利用SPA提取的特征波長(zhǎng)分別為410 nm、481 nm、533 nm、702 nm和798 nm。702 nm和798 nm兩個(gè)波段與用于葉綠素含量反演指數(shù)使用的705 nm和750 nm波段基本一致。410 nm、481 nm和533 nm的特征波段與文獻(xiàn)中用于研究水稻拔節(jié)期的波段相似。綜合分析表明,不同的研究在特征波段的光譜區(qū)域選擇上存在重疊和差異。特征波段的差異主要是由于品種、生長(zhǎng)期、環(huán)境條件和數(shù)據(jù)處理方法等方面的差異造成的,例如,(1)本研究所用的水稻品種與以往的研究不同;(2)稻田水分、雜草和土壤的存在可能影響高光譜信息。
利用從SPA中提取的波段的反射率作為自變量,以實(shí)測(cè)葉綠素含量作為因變量。采用粒子群算法PSO-ELM建立反演模型。為了比較,我們還測(cè)試了傳統(tǒng)ELM的反演結(jié)果。在PSO-ELM中,粒子群迭代次數(shù)為100次。由于粒子群優(yōu)化算法的參數(shù)很多,本研究設(shè)計(jì)了一個(gè)正交陣列來(lái)確定最佳的粒子群優(yōu)化參數(shù)。結(jié)果如表1所示,其中每個(gè)參數(shù)可以取5個(gè)值中的一個(gè),并且共有5個(gè)參數(shù)。
圖1 單波段相關(guān)性分析
表1 PSO-ELM 正交陣列
表2總結(jié)了PSO-ELM參數(shù)的正交陣列結(jié)果,其中Wij是從參數(shù)j的第i個(gè)值得到的R2之和。例如,W11是通過(guò)計(jì)算第一個(gè)參數(shù)的第一個(gè)值對(duì)應(yīng)的R2之和得到的,pop = 40,而W12是通過(guò)計(jì)算第二個(gè)參數(shù)的第一個(gè)值對(duì)應(yīng)的R2之和得到的,w = 0.3。具體計(jì)算公式如下所示。
每一列表明了一個(gè)參數(shù)對(duì)預(yù)測(cè)精度的影響。例如,在第一列中,對(duì)于i = 1,... ,5,Wi1之間的差異揭示了種群大小如何影響反演模型的準(zhǔn)確性,而與其他參數(shù)的值無(wú)關(guān)。由于W21 ≥ Wi1,我們得出結(jié)論,最大化R2的種群大小應(yīng)該是正交陣列中的第二個(gè)值,也就是pop = 50。同樣,對(duì)應(yīng)于w、C1、C2和m的列分別在W52、W33、W34和W35處最大化。因此,參數(shù)的最佳值是pop = 50,w = 0.9 ~ 0.3,C1 = 1.65,C2 = 2.8和 m = 0.2。
表2 PSO-ELM正交陣列結(jié)果分析
通過(guò)正交陣列獲得的一組參數(shù),我們可以得到PSO-ELM粳稻葉綠素含量反演模型。將新建立的反演模型應(yīng)用于實(shí)驗(yàn)數(shù)據(jù),得到R2 = 0.791,RMSE = 8.215 mg/L。結(jié)果遠(yuǎn)優(yōu)于ELM模型,該模型的R2 = 0.667,RMSE = 11.308 mg/L。反演結(jié)果表明,PSO-ELM模型對(duì)葉綠素含量的預(yù)測(cè)效果明顯優(yōu)于傳統(tǒng)ELM模型(圖2)。
圖2 粳稻冠層葉綠素含量反演結(jié)果
通過(guò)增加無(wú)人機(jī)平臺(tái)和地面數(shù)據(jù)的采集量,可以提高反演模型的精度。更多的數(shù)據(jù)可以減少由噪聲、干擾和不可避免的采集誤差引起的不確定性。此外,本研究只建立了供試粳稻品種的反演模型。為了提高模型的準(zhǔn)確性和普適性,今后的研究重點(diǎn)是增加試驗(yàn)品種數(shù)量,建立不同生育期粳稻葉綠素含量反演模型。
UAV-HSI平臺(tái)能夠?qū)λ旧L(zhǎng)信息進(jìn)行快速、準(zhǔn)確和無(wú)損評(píng)估。本文提出的方法可以及時(shí)了解水稻的生長(zhǎng)狀況,這對(duì)于水稻施肥管理至關(guān)重要。不過(guò),該方法面臨的一個(gè)挑戰(zhàn)是水稻葉片葉綠素含量隨水稻品種、肥力期、生長(zhǎng)環(huán)境等因素不斷變化,所得結(jié)果僅適用于東北水稻,而其他水稻品種需要獲得新的模型參數(shù)。
作者信息
許童羽,博士,沈陽(yáng)農(nóng)業(yè)大學(xué)信息與電氣工程學(xué)院教授,博士生導(dǎo)師。
主要研究方向:精準(zhǔn)農(nóng)業(yè)航空、農(nóng)業(yè)信息化、農(nóng)業(yè)電氣化。
參考文獻(xiàn):
Cao, Y.L., Jiang, K.L., Wu, J.X., Yu, F.H., Du, W., & Xu, T.Y. (2020). Inversion modeling of japonica rice canopy chlorophyll content with UAV hyperspectral remote sensing. PLoS One, 15(9):e0238530.
https://doi.org/10.1371/journal.pone.0238530
地址:無(wú)錫市梁溪區(qū)南湖大道飛宏路58-1-108
電話(huà):13810664973
郵箱:info@dualix.com.cn
地址:北京市海淀區(qū)中關(guān)村大街19號(hào)
電話(huà):13810664973
郵箱:info@dualix.com.cn
地址:陜西省西安市高新區(qū)科技一路40號(hào)盛方科技園B座三層?xùn)|區(qū)
電話(huà):13810664973
郵箱:info@dualix.com.cn
地址:成都市青羊區(qū)順城大街206號(hào)四川國(guó)際大廈七樓G座
電話(huà):13810664973
郵箱:info@dualix.com.cn