基于高光譜圖像技術(shù)的隱形字快速識別研究
[導讀] 著名作家、詩人、評論家、政論家、學者高爾基曾利用牛奶在白紙上寫字,待白紙風干后,字跡也隨之消失,從而達到隱形傳遞消息的目的。那怎樣恢復白紙上的字跡呢?根據(jù)史書記載,將白紙用火烤一下,字跡就會慢慢的變得清晰起來,這是因為牛奶中含有蛋白質(zhì),而蛋白質(zhì)在60攝氏度左右變性,凝固,顯現(xiàn)出來,而紙的燃點達到130度以上,因此用火烤一下可以使牛奶字跡清晰。但是用飽和鹽水、眼液、淀粉水在白紙上寫字,待白紙風干后,字跡消失了,然而利用火烤的方法卻無法將白紙上的字跡識別出來。因此需要借助其他辦法來快速識別任何液體書寫的隱形字跡。
將牛奶、飽和鹽水、眼液分別在白色A4紙上寫上字,待溶液曬干后利用短波紅外相機(1000nm-2500nm)對其分別進行測試,獲取其在短波紅外波段的高光譜圖像和光譜信息。SWIR短波紅外相機光譜分辨率為8-10nm,像素為384x288,波段數(shù)為288個。測試設備及SWIR短波紅外相機如圖1所示。
圖1 測試設備及SWIR短波紅外相機
對獲取的高光譜圖像數(shù)據(jù)進行黑白幀校正得到圖像的光譜反射率數(shù)據(jù),同時對反射率數(shù)據(jù)進行壞點(NAN)進行修復,剔除掉異常值,從而得到牛奶、飽和鹽水、眼液及背景(白紙)的光譜反射率數(shù)據(jù),如圖2所示。從圖2可知,干牛奶與未干牛奶,其在白紙上寫的字跡光譜反射率差異較大;當牛奶曬干后,字跡的光譜反射率與白紙十分相似,變化規(guī)律也趨向一致,對光譜進行放大分析可知,牛奶字跡的光譜反射率總體上高于白紙的光譜反射率。對于飽和鹽水字跡而言,干飽和鹽水字跡與未干飽和鹽水字跡在光譜反射率上差異較為明顯,特別是在水汽吸收帶1420 nm和1910 nm附近差異更為顯著;當飽和鹽水曬干后,飽和鹽水字跡的光譜反射率與白紙的光譜反射率變化趨勢一致,但是白紙的光譜反射率高于飽和鹽水字跡的光譜反射率。運用眼液在白紙上寫上字,待眼液曬干后,去牛奶字跡、鹽水字跡一樣,肉眼無法識別出是什么字,利用短波紅外相機測試其光譜反射率發(fā)現(xiàn),眼液曬干后,其字跡的光譜反射率與白紙的光譜反射率變化趨勢依然一致,但是眼液字跡的光譜反射率高于白紙的光譜反射率。
圖2 牛奶、飽和鹽水、眼液及背景(白紙)的光譜反射率
由于高光譜遙感數(shù)據(jù)波段多,波段間存在很大相關性,為了克服維數(shù)災難,利用最小噪聲分離變換進行波段選擇,達到優(yōu)化數(shù)據(jù),去除噪聲和數(shù)據(jù)降維的目的。
最小噪聲分離變換( MNF)是對主成分變換( PCA) 的一種改進方法。PCA 是一種線性變換,變換后各主成分分量彼此之間互不相關,隨著主成分的增加該分量包含的信息量減小,第一主成分包含的信息量最大,第二主成分與第一主成分無關且在剩余成分中包含的信息量最大,依此類推。但PCA對噪聲比較敏感,在變換后的主成分分量中,信息量大的信噪比不一定高,當某個信息量大的主成分中包含的噪聲的方差大于信號的方差時,該主成分分量形成的圖像質(zhì)量就差。針對 PCA 變換的不足,Green 和 Berman 提出最小噪聲分離變換( MNF),它不但能判定圖像數(shù)據(jù)內(nèi)在的維數(shù)( 波段數(shù)) ,分離數(shù)據(jù)中的噪聲,而且能減少隨后處理中的計算需求量。MNF 變換是基于圖像質(zhì)量的線性變換,變換結(jié)果的成分按照信噪比從大到小排列。經(jīng)過MNF變換大部分噪聲集中在特征小的分量中。而不像 PCA變換按照方差由大到小排列,從而克服了噪聲對影像質(zhì)量的影響。
圖3列舉了牛奶隱形字原圖(手機拍攝)、MNF變換前5個成分。從圖中可知原圖看不到任何字跡模樣,但經(jīng)過MNF變換后,第1、2、3、4成分能較好地識別出隱形字跡,其中第2成分隱形字跡識別效果最佳。第1成分中隱形字較亮的部分是因為牛奶尚未完全風干,第2成分隱形字較亮、較暗的部分同樣是因為牛奶尚未完成風干,導致MNF變換中其信息較為顯著,如圖2可知干牛奶區(qū)域和未干牛奶區(qū)域的光譜反射率曲線差異較為顯著。第3、4、5成分隱形字的灰度不完全一致,也是因為牛奶未完全風干的原因。
圖3 牛奶隱形字原圖及MNF前5個成分
圖4列舉了飽和鹽水隱形字原圖(手機拍攝)、MNF變換前5個成分。從圖中可知原圖看不到字跡模樣,但經(jīng)過MNF變換后,第1、3成分能較好地識別出隱形字跡,其中第1成分隱形字跡識別效果最佳。第2、4、5以及往后的成分均無法識別出飽和鹽水的字跡。第1成分中隱形字較亮的部分和第3成分隱形字較暗部分是因為牛奶尚未完全風干的原因,從圖2可知干飽和鹽水區(qū)域和未飽和鹽水區(qū)域的光譜反射率曲線差異較為顯著。
圖4飽和鹽水隱形字原圖及MNF前5個成分
圖5列舉了眼液隱形字原圖(手機拍攝)、MNF變換前5個成分。從原圖中依然無法看到隱形字跡,但經(jīng)過MNF變換后,第1成分能較好地識別出隱形字跡,第2、3、4、5以及往后的成分均無法識別眼液書寫的字跡。
圖5眼液隱形字原圖及MNF前5個成分
針對高光譜數(shù)據(jù)信息量豐富,但數(shù)據(jù)冗余且包含噪聲的特點,本文基于最小噪聲分離變換算法有效地對不同液體書寫的隱形字高光譜圖像進行降維處理,分離了圖像中的有效信息和噪聲,減小了后期處理的數(shù)據(jù)量,提高了數(shù)據(jù)處理效率。通過對隱形字高光譜數(shù)據(jù)進行最小噪聲分離變換,從而清晰地識別出了隱形字體,實驗結(jié)果對于文物考古、刑偵領域識別隱形字跡提供了參考和借鑒。
地址:無錫市梁溪區(qū)南湖大道飛宏路58-1-108
電話:13810664973
郵箱:info@dualix.com.cn
地址:北京市海淀區(qū)中關村大街19號
電話:13810664973
郵箱:info@dualix.com.cn
地址:陜西省西安市高新區(qū)科技一路40號盛方科技園B座三層東區(qū)
電話:13810664973
郵箱:info@dualix.com.cn
地址:成都市青羊區(qū)順城大街206號四川國際大廈七樓G座
電話:13810664973
郵箱:info@dualix.com.cn