[發明專利]卷積神經網絡及基于卷積神經網絡的圖像處理方法在審
| 申請號: | 202010048134.6 | 申請日: | 2020-01-16 |
| 公開(公告)號: | CN113128662A | 公開(公告)日: | 2021-07-16 |
| 發明(設計)人: | 李永;吳岳辛;葉翔;劉瑩;姜衛星;豐·石;張高鑫;王凡;何子航;李慧;胡嘉豪;李婉婷;趙家鳳;李鳳男;王偉剛 | 申請(專利權)人: | 波音公司;北京郵電大學 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08;G06K9/62 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 李子光 |
| 地址: | 美國伊*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 卷積 神經網絡 基于 圖像 處理 方法 | ||
本公開涉及卷積神經網絡及基于卷積神經網絡的圖像處理方法,卷積神經網絡包括:至少一個卷積層,每個卷積層包括至少一個卷積核組,每個卷積核組包括兩個以上的卷積核,每個卷積核組的各卷積核對輸入的具有不同旋轉角度的圖像數據的相同特征進行特征提取以獲得特征圖,卷積核組的一個卷積核經過旋轉能得到卷積核組的其他卷積核;以及至少一個池化層,每個池化層利用與卷積核組的各卷積核分別對應的池化窗口對各卷積核輸出的特征圖進行池化,以輸出池化后的特征圖,其中,通過繞與卷積核組的一個卷積核對應的池化窗口的中心而旋轉該池化窗口,能得到與卷積核組中的其他卷積核對應的池化窗口。本公開的卷積神經網絡自身具有旋轉不變性。
技術領域
本公開涉及神經網絡技術領域,尤其涉及一種卷積神經網絡及基于卷積神經網絡的圖像處理方法。
背景技術
近年來,深度神經網絡在模式識別領域進行大量應用,例如,深度神經網絡已應用于目標檢測、人臉識別、語義分割等。這些應用與深度神經網絡能夠學習具有強表達能力的特征(圖像的表示方法)息息相關。手工提取特征的方法通過引入專家知識能提取圖像的低層級特征。與傳統的手工提取特征的方法相比,深度神經網絡依靠數據驅動,能夠學習圖像的包括低層級、中層級及高層級特征的各層級特征。神經網絡提取圖像特征的工作方式類似于人類的視覺系統,因而在識別效果上優于手工提取特征的方法。
卷積神經網絡固有的平移不變性,使其對目標在圖像中的位置具有很強的魯棒性。但是卷積神經網絡對旋轉和尺度縮放比較敏感,不具有旋轉和尺度不變性。最近,已經提出一些方案試圖將旋轉不變性引入到卷積神經網絡。這些方案大致分為兩類:
1)采用數據增廣的方法,將訓練集中的樣本做旋轉變換得到增廣數據集,然后用來訓練普通的卷積神經網絡結構或者專門設計的一些卷積神經網絡結構,得到具有旋轉不變性的卷積神經網絡模型。
2)完全不需要對訓練集的樣本進行數據增廣,但改變卷積神經網絡的卷積核的結構,來得到具有旋轉不變性的卷積神經網絡模型。
采用數據增廣的方法,能夠獲得一定的旋轉不變性,但是數據增廣需要對數據做預處理,同時,增廣使得訓練集的樣本量成倍增加,使得訓練成本成倍增加。此外,數據增廣需要更大的卷積神經網絡模型,增加了模型過擬合的風險。通過改變卷積核結構的現有方法,無法主動的對輸入做旋轉變換。
發明內容
本公開是考慮現有技術存在的上述問題而作出,本公開采用旋轉卷積核及池化窗口的方式給卷積神經網絡帶來旋轉不變性,從而克服現有技術中的上述缺陷之一或全部。
根據本公開實施例的一方面,提供了一種卷積神經網絡,包括:至少一個卷積層,每個卷積層包括至少一個卷積核組,每個卷積核組包括兩個以上的卷積核,每個卷積核組的各卷積核對輸入的具有不同旋轉角度的圖像數據的相同特征進行特征提取以獲得特征圖,其中,卷積核組的一個卷積核經過旋轉能得到卷積核組的其他卷積核;以及至少一個池化層,每個池化層利用與卷積核組的各卷積核分別對應的池化窗口對各卷積核輸出的特征圖進行池化,以輸出池化后的特征圖,其中,通過繞與卷積核組的一個卷積核對應的池化窗口的中心而旋轉該池化窗口,能得到與卷積核組中的其他卷積核對應的池化窗口。
在根據本公開的一示例性實施例中,卷積神經網絡還包括特征圖選擇層,特征圖選擇層將經過所有池化層池化后的且來源于屬于同一卷積核組的各卷積核的特征圖進行比較,并選出具有最大值的特征圖,作為該卷積核組對圖像數據提取的特征圖。
在根據本公開的一示例性實施例中,卷積核組包括第一卷積核,第一卷積核由F0表示,卷積核組中的其他卷積核由Fi表示,則其他卷積核Fi通過以下公式獲得:
Fi(c,p,q)=F0(c,p′,q′),其中
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于波音公司;北京郵電大學,未經波音公司;北京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202010048134.6/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





