[發明專利]基于CAE與HL-CNN的小樣本SAR目標識別方法有效
| 申請號: | 201911029117.1 | 申請日: | 2019-10-28 |
| 公開(公告)號: | CN110766084B | 公開(公告)日: | 2021-06-15 |
| 發明(設計)人: | 傅雄軍;秦銳;郎平;常家云;蔣文;趙聰霞 | 申請(專利權)人: | 北京理工大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04 |
| 代理公司: | 北京正陽理工知識產權代理事務所(普通合伙) 11639 | 代理人: | 王民盛 |
| 地址: | 100081 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 cae hl cnn 樣本 sar 目標 識別 方法 | ||
1.基于CAE與HL-CNN的小樣本SAR目標識別方法,其特征在于:包含兩個網絡的構建與訓練,分別為CAE特征表示學習網絡與HL-CNN分類網絡;
其中,CAE,即卷積自編碼器,全稱為ConvolutionalAuto-encoder;HL-CNN,全稱為hinge loss CNN;CNN,即卷積神經網絡,全稱為Convolutional Neural Network;SAR,即合成孔徑雷達,全稱為Synthetic Aperture Radar;
CAE特征表示學習網絡通過重構訓練集中的圖像自動學習圖像的特征,得到一個完備的特征表示,防止使用非貪婪的分類網絡時因特征提取不足而導致分類性能下降的問題;
HL-CNN分類網絡采用一種基于最大類間間距準則的非貪婪分類器對CAE特征表示學習網絡學習到的特征表示微調并得到分類網絡,能有效防止過擬合現象的發生;
其中,CAE特征表示學習網絡重構圖像自動學習圖像的特征即通過優化目標hw(x)≈(x)學習x的特征表示,式中,h表示重構函數,x為給定的一個輸入圖像,下標w表示網絡的權值;
所述方法,包括網絡構建與訓練階段以及識別階段;
其中,網絡構建與訓練階段又包括構建訓練樣本集及標記樣本、構建CAE特征表示學習網絡、訓練CAE特征表示學習網絡、構建HL-CNN分類網絡、特征表示遷移、訓練HL-CNN分類網絡,具體分為如下步驟:
步驟1.1:構建訓練樣本集及標記樣本;
其中,訓練樣本集包括增廣訓練樣本集以及原始訓練樣本集;
采用隨機裁剪固定尺寸切片的方法對訓練樣本進行增廣,構建增廣訓練樣本集;裁剪訓練樣本中心固定尺寸的切片,構建原始訓練樣本集;使用one-hot編碼對樣本進行標記;
步驟1.2:構建CAE特征表示學習網絡,具體包括編碼器構建以及解碼器構建;
其中,構建的編碼器包括多個卷積層、池化層以及激活函數的連接與參數設置;
其中,卷積層包括補零操作和卷積操作,補零操作對卷積層的輸出尺寸進行約束,卷積操作使用卷積核對輸入圖像進行滑窗并做卷積,得到該層的輸出圖像;
其中,池化層包括池化操作,具體實施時使用最大值池化;
編碼器的輸出即為特征表示,記做pw1(x),其中,下標w1表示編碼器的隱含層中的權值,x表示編碼器的輸入;
解碼器構建包括多個去卷積層、上池化層以及激活函數的連接與參數設置;
其中,去卷積層等同于卷積層;上池化層為池化層的逆操作;激活函數根據具體實例選取;
其中,解碼器的輸入為編碼器的輸出,即pw1(x),它將特征表示pw1(x)還原成x,表示為qw2(pw1(x))=x,其中下標w2表示解碼器的隱含層的權值;
步驟1.3:訓練CAE特征表示學習網絡,具體使用增廣訓練樣本集訓練步驟1.2所構建的CAE特征表示學習網絡,具體包括如下子步驟:
步驟1.3.1:網絡參數初始化,將卷積層的卷積核及每一層的權重值初始化,并設置合理的學習率;
步驟1.3.2:使用帶Momentum參數的小批量隨機梯度下降方法對網絡進行訓練;
步驟1.4:構建HL-CNN分類網絡,具體為:
步驟1.4.1:構建與步驟1.2中CAE特征表示學習網絡的編碼器部分完全相同的結構;
步驟1.4.2:在步驟1.4.1所述結構后添加全連接層;
步驟1.4.3:將最后一層全連接層的激活函數設置為linear函數,并使用Multiclasshinge loss作為HL-CNN分類網絡的損失,然后連接到預測標簽,至此,HL-CNN分類網絡構建完成;
其中,HL-CNN分類網絡的損失表示為(1):
其中,xn是網絡的第n個輸入,n=1,…,N,N表示所有訓練樣本數量,yn表示xn的實際標簽,wc表示網絡輸出標簽中第c類位置對應的權值,c表示類別,c=1,…,C,C是總類別數,表示網絡輸出標簽中第yn類位置對應的權值,T表示矩陣轉置操作符,△為閾值;
步驟1.5:特征表示遷移,具體為:將CAE特征表示學習網絡訓練得到的特征表示,即步驟1.3輸出的訓練后的編碼器參數,加載到步驟1.4的HL-CNN分類網絡中與編碼器相同的部分;
步驟1.6:使用原始訓練樣本集訓練HL-CNN分類網絡,具體為:
步驟1.6.1:為步驟1.5加載參數后的HL-CNN分類網絡初始化全連接層參數并設置網絡的學習率;
步驟1.6.2:使用帶momentum參數的小批量隨機梯度下降方法對該網絡進行訓練,得到訓練好的CAE-HL-CNN分類模型;
至此,從步驟1.1到步驟1.6,完成了CAE-HL-CNN的訓練階段;
識別階段,包含測試樣本集構建以及CAE-HL-CNN識別,具體包括如下步驟:
步驟2.1:測試樣本集構建,具體如下:
裁剪測試樣本中心固定尺寸的切片,構建測試樣本集,切片尺寸與訓練樣本集切片尺寸相同;使用one-hot編碼對樣本進行標記;
步驟2.2:CAE-HL-CNN識別,將測試樣本集中的測試樣本輸入到訓練好的CAE-HL-CNN分類模型,輸出識別結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京理工大學,未經北京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201911029117.1/1.html,轉載請聲明來源鉆瓜專利網。





