[發明專利]基于通道增強的雙注意力生成對抗網絡及圖像生成方法在審
| 申請號: | 202011470128.6 | 申請日: | 2020-12-14 |
| 公開(公告)號: | CN112580782A | 公開(公告)日: | 2021-03-30 |
| 發明(設計)人: | 羅健旭;岳丹陽 | 申請(專利權)人: | 華東理工大學 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/08;G06T1/00 |
| 代理公司: | 北京格允知識產權代理有限公司 11609 | 代理人: | 張莉瑜 |
| 地址: | 200237 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 通道 增強 注意力 生成 對抗 網絡 圖像 方法 | ||
1.一種基于通道增強的雙注意力生成對抗網絡,其特征在于:包括生成器和判別器;所述生成器包括卷積塊一和雙注意力機制模塊;所述判別器包括卷積塊二和雙注意力機制模塊;
其中,卷積塊一、卷積塊二中均設有用于通過壓縮激活操作獲取通道注意力的壓縮激活操作層;
所述雙注意力機制模塊包括并行的位置注意力單元與通道注意力單元;所述位置注意力單元基于自注意力機制建立位置間關聯性,得到位置注意力特征,所述通道注意力單元基于通道注意力機制建立特征通道間依賴性,得到通道注意力特征;所述雙注意力機制模塊融合位置注意力特征和通道注意力特征。
2.根據權利要求1所述的雙注意力生成對抗網絡,其特征在于,
所述壓縮激活操作層用于執行如下操作:
將特征M每層取平均,壓縮成一個值,得到一維向量s,表達式為:
其中,特征M的層數為C,每層尺寸為H×W,sn表示一維向量s的第n個元素,mn表示特征M的第n層,n=1,...,C,mni,j表示mn中坐標為(i,j)的元素;
將一維向量s經兩層非線性全連接網絡學習進行激活,得到具有每層權重比例的權重特征向量w,表達式為:
w=σ2(W2σ1(W1s))
其中,W1、W2分別表示第一、二層全連接操作,σ1、σ2分別為激活函數ReLU和Sigmoid;
將權重特征向量w乘到特征M的對應層中,得到校準后的特征表達式為:
其中,wn表示權重特征向量w的第n個元素,表示特征的第n層。
3.根據權利要求2所述的雙注意力生成對抗網絡,其特征在于,
所述壓縮激活操作層包括依次連接的平均池化層、1×1卷積層、ReLU激活層、1×1卷積層、Sigmoid激活層,輸出與輸入進行通道倍乘,得到校準后的特征。
4.根據權利要求3所述的雙注意力生成對抗網絡,其特征在于,
所述卷積塊一包括兩個線性層、兩個批歸一化層、兩個ReLU激活層、兩個上采樣層、兩個3×3卷積層、1×1卷積層和所述壓縮激活操作層;
所述卷積塊二包括兩個ReLU激活層、兩個3×3卷積層、1×1卷積層、兩個平均池化層和所述壓縮激活操作層。
5.根據權利要求1所述的雙注意力生成對抗網絡,其特征在于,
所述通道注意力單元用于執行如下操作:
將特征A進行重組,得到特征A′;其中,特征A的層數為C,每層尺寸為H×W,特征A′的尺寸為C×N,N=H×W;
將特征A′與特征A′的轉置相乘取softmax,得到特征圖Q,特征圖Q的尺寸為C×C,特征圖Q中的元素qji表達式為:
其中,{i,j=1,2,…,C},a′i為特征A′的第i個特征向量,a′Tj為特征A′的轉置的第j個特征向量;
將特征圖Q與特征A′相乘并進行反重組,得到通道注意力特征T,表達式為:
其中,Tj表示通道注意力特征T的第j個特征向量,j=1,2,…,C,β表示學習參數,初始化為0,Aj表示特征A的第j個特征向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華東理工大學,未經華東理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202011470128.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種吸氣式感煙探測器故障定位系統及方法
- 下一篇:一種皮革制品邊緣裁切設備





