背景
水分含量(Moisture content, MC)和脂肪酸含量(Fatty acid content, FAC)是大米品質的重要指標,影響大米的存儲和食用品質。因此,建立一種快速、準確、無損的MC和FAC檢測方法至關重要。
可見/近紅外光譜可以響應樣品中的某些含氫基團,從而獲得樣品中的內部化學信息。該技術已被用于檢測農產品中的水分和脂肪酸含量。同時,與可見光/近紅外光譜相比,高光譜成像(Hyperspectral imaging, HSI)技術具有光譜與圖像相結合的優(yōu)勢。利用每個像素點的光譜預測水稻的MC和FAC,形成水稻的MC和FAC的可視化分布,使檢測結果更加直觀。但是,HSI技術也存在數據量大、實時性差等缺點,難以在實際中應用。然而,這些問題可以通過數據降維和特征波長選擇來解決。
本研究的目的是結合HSI技術與化學計量學方法,建立一種快速簡便的水稻MC和FAC檢測方法。(1)采用不同的預處理方法對大米和精米的光譜進行預處理,建立了MC和FAC的全波段預測模型。最后根據模型性能確定*佳預處理方法。(2)采用兩種變量選擇方法篩選大米和精米在900~1700 nm區(qū)域的MC和FAC的顯著波長。(3)比較了MC和FAC模型在大米和精米中的性能,并分析了稻殼對MC和FAC模型性能的影響。(4)利用*佳模型預測每個像素點的MC和FAC,實現水稻樣品MC和FAC的可視化。
試驗設計
浙江農林大學孫通副教授團隊利用GaiaField-N17E高光譜成像系統(江蘇雙利合譜)獲取了13個水稻品種的大米和精米高光譜影像(圖1)。近紅外高光譜成像儀的光譜范圍為900~1700 nm,空間分辨率為640像素,波段數為512,光譜分辨率為5 nm。對獲得的高光譜影像利用OTSU方法獲取其前景像素,并計算大米和精米平均光譜。
預處理可以去除高頻隨機噪聲和基線漂移等噪聲,提高模型性能。本研究采用了5種預處理方法,包括多元散射校正(MSC)、標準正態(tài)變量變換(SNV)、Savitzky-Golay(SG)平滑、SG+一階導數和SG導數。根據全波段模型的性能,選擇最合適的預處理方法。為提高計算速度,減少數據冗余,本研究采用競爭自適應重加權采樣(CARS)和連續(xù)投影算法(SPA)選擇大米/精米中MC和FAC的顯著波長。
圖1高光譜成像系統
結論
大米和精米在900~1700 nm波長范圍內的原始反射光譜如圖2所示。從圖2可以看出,大米和精米的光譜在900~1400 nm波長范圍內具有相同的趨勢。然而,大米的反射光譜逐漸增加,而精米的反射光譜在1400~1700 nm波長范圍內趨于穩(wěn)定。此外,大米光譜的反射率值普遍高于精米。這可能是由于大米和精米的顏色、光滑度和透明度不同造成的。在960、1200和1450 nm處有三個明顯的峰。960 nm左右的峰值可能是由水和碳水化合物中O-H二階泛音的協同作用引起的。1200 nm左右的峰值與樣品的MC有關,1450 nm左右的峰值歸因于O-H拉伸第一泛音。
圖2 大米(a)和精米(b)樣品的原始光譜
采用5種預處理方法對大米和精米樣品的光譜進行處理,利用PLSR算法建立MC和FAC的估測模型。由表1可知,在“大米-水分”模型中,SNV和SG-2預處理效果更好。采用SNV預處理建立的模型R2較高,達到0.9682。但該模型不穩(wěn)定,魯棒性較差。因此,SG-2模型的性能優(yōu)于SNV模型。在“大米-脂肪酸”模型中,SG-2是*佳的預處理方法。對于“精米-水分”模型,SG-2預處理的R2較高。綜上所述,在“大米-水分”、“精米-水分”和“大米-脂肪酸”3種預測模型中,SG-2是*佳的預處理方法。而在“精米-脂肪酸”模型中,SG平滑是*好的預處理方法,模型的R2p和RMSEP分別為0.8427和1.7806。
從表1可以看出,大米中MC的模型性能優(yōu)于精米。這是因為稻殼含有水分,其吸水能力高于精米。因此,當大米樣品經過水處理后,稻殼比精米吸收更多的水分。因此,大米光譜中含有的水分信息比精米光譜中含有的水分信息更多。相比之下,精米中FAC的模型性能優(yōu)于大米。稻殼主要由纖維素、半纖維素、木質素等成分組成,其中不含脂肪酸。稻殼中存在的干擾信息會影響建模過程中脂肪酸的預測。因此,得到的光譜信息可能會受到谷殼的干擾,導致精米的預測精度降低。
表1 不同預處理方法下樣品中水分和脂肪酸的PLS模型預測結果
由于采用SG或SG-2預處理的MC和FAC模型效果*好,因此對這些光譜進行了CARS和SPA特征優(yōu)選。由表2可以看出,相較于CARS,SPA選擇更少的重要波長,使實際應用更容易,同時SPA模型的RPD值較高,模型精度較高。此外,SPA模型的性能優(yōu)于全波段模型,這表明SPA選擇的波長幾乎包含了MC或FAC的所有有效信息。與全波段模型的結果相似,SPA模型對大米中MC的預測精度高于精米,而對大米中FAC的預測精度低于精米。“大米-水分”、“精米-水分”、“大米-脂肪酸”的*佳模型為“SG2-SPA-PLS”,“精米-脂肪酸”的*佳模型為“SG-SPA-PLS”。
SPA選擇的波長如表3所示。MC模型選擇的964.17、965.74、975.16、978.29、1373.75和1395.72 nm波長與水分波長相似,歸功于O-H拉伸的第一、第二和第三泛音。對于FAC模型,選擇的1095.99、1387.87和1516.56 nm波長歸功于C-H的一、二泛音和-CH2基團的拉伸,選取的939.06、964.17和967.31 nm波長主要來自于O-H鍵的彎曲振動。
表2 使用選定波長的樣品中水分和脂肪酸的PLS模型預測結果
表3 由SPA選擇的波長
通過Fearn(1996)提出的方法驗證稻殼對MC和FAC預測精度的影響。在95%置信水平下計算區(qū)間是否包含0。如果它包含0,則偏差在5%的水平上沒有顯著差異。由表4可知,大米和精米中MC的預測誤差計算區(qū)間均為0,而FAC的不為0。這表明大米與精米中FAC的預測誤差存在顯著差異,因此稻殼對FAC的預測精度有一定的影響。
表4 大米和精米的水分和脂肪酸含量在95%置信水平上存在顯著差異
圖3為不同水分梯度下水稻樣品MC的可視化結果。可以看出,水稻樣本的MC越高,可視化圖像中的紅色區(qū)域越大,而水稻樣本的MC越低,可視化圖像中的藍色區(qū)域越大。這與大米樣本的實際MC一致,說明MC模型對每個像素的MC預測是準確的。此外,可視化圖像中大米樣品的MC分布不均勻,這可能是由于樣品處理過程中吸濕不均勻造成的。圖4為大米樣品FAC可視化結果。FAC模型可以準確預測每個像素的FAC??梢暬梢灾庇^地反映水稻中MC和FAC的空間變化,可以在像元水平上了解MC和FAC的分布情況。因此,在儲存前檢驗和儲存監(jiān)測中,可以在很小的范圍內檢測到異常的MC和FAC,從而保證了大米的質量安全。
圖3 大米含水量可視化圖
圖4 大米脂肪酸含量可視化圖
作者信息
孫通,博士,浙江農林大學光機電工程學院副教授,碩士生導師。
主要研究方向:農林產品光譜智能檢測技術研究及裝備開發(fā)。
參考文獻:
Song, Y., Cao, S., Chu, X., Zhou, Y., Xu, Y., Sun, T., Zhou, G., & Liu, X. (2023). Non-Destructive Detection of Moisture and Fatty Acid Content in Rice using Hyperspectral Imaging and Chemometrics. Journal of Food Composition and Analysis, 11.
https://doi.org/10.1016/j.jfca.2023.105397
地址:無錫市梁溪區(qū)南湖大道飛宏路58-1-108
電話:13810664973
郵箱:info@dualix.com.cn
地址:北京市海淀區(qū)中關村大街19號
電話:13810664973
郵箱:info@dualix.com.cn
地址:陜西省西安市高新區(qū)科技一路40號盛方科技園B座三層東區(qū)
電話:13810664973
郵箱:info@dualix.com.cn
地址:成都市青羊區(qū)順城大街206號四川國際大廈七樓G座
電話:13810664973
郵箱:info@dualix.com.cn