[發(fā)明專利]可編程深度神經(jīng)網(wǎng)絡(luò)處理器有效
| 申請?zhí)枺?/td> | 201810281984.3 | 申請日: | 2018-04-02 |
| 公開(公告)號: | CN108520297B | 公開(公告)日: | 2020-09-04 |
| 發(fā)明(設(shè)計(jì))人: | 周軍;王波 | 申請(專利權(quán))人: | 周軍 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06N3/063 |
| 代理公司: | 成都佳劃信知識產(chǎn)權(quán)代理有限公司 51266 | 代理人: | 幸偉山 |
| 地址: | 610000 四川省成*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 可編程 深度 神經(jīng)網(wǎng)絡(luò) 處理器 | ||
1.可編程深度神經(jīng)網(wǎng)絡(luò)處理器,包括程序控制單元、濾波器緩存區(qū)、特征圖緩存區(qū),其特征在于:
所述特征圖緩存區(qū)用于緩存多張?zhí)卣鲌D,所述特征圖由像素點(diǎn)數(shù)據(jù)構(gòu)成;
所述濾波器緩存區(qū)用于緩存與特征圖匹配的權(quán)值數(shù)據(jù);
還包括層處理引擎,所述層處理引擎包括依次設(shè)置的卷積單元、激活函數(shù)單元和池化單元,所述卷積單元包括依次設(shè)置的乘累加單元、卷積累加單元和特征圖累加單元,所述乘累加單元為5×5的乘加陣列,所述特征圖緩存區(qū)和濾波器緩存區(qū)與層處理引擎的輸入端連接,在特征圖緩存區(qū)和層處理引擎的輸入端之間還設(shè)有一數(shù)據(jù)整形及復(fù)用單元;
處理方法為:
(1)程序控制單元獲取用戶指令,解析用戶指令,得到神經(jīng)網(wǎng)絡(luò)的參數(shù),包括每一層的特征圖尺寸、權(quán)值卷積核尺寸、卷積步長、輸入特征圖數(shù)量、輸出特征圖數(shù)量,以及卷積層數(shù)量、池化層數(shù)量、全連接層數(shù)量;
程序控制單元從特征圖緩存區(qū)中讀取一張?zhí)卣鲌D作為輸入特征圖,并根據(jù)輸入特征圖從濾波器緩存區(qū)中獲取其對應(yīng)的權(quán)值數(shù)據(jù),其中輸入圖像的像素為Xin*Xin,對應(yīng)權(quán)值數(shù)據(jù)的像素為Y*Y,卷積運(yùn)算的步長為S;
(2)根據(jù)權(quán)值的像素和乘累加單元的大小,計(jì)算復(fù)用幾次乘累加單元N,N=Y(jié)*Y/25,且N為整數(shù);
(3)計(jì)算得到一個中間輸出點(diǎn)MO1;
(31)按照Y*Y個像素點(diǎn)的個數(shù),數(shù)據(jù)整形及復(fù)用單元從輸出圖片左上角讀取第一組像素點(diǎn)I1,對其進(jìn)行存儲和標(biāo)記后,將I1送入乘累加單元,復(fù)用N次乘累加單元后,計(jì)算得到第一個中間輸出點(diǎn)MO1;
(32)在I1正下方讀取第二組像素點(diǎn),所述第二組像素點(diǎn)個數(shù)為S*Y,且第二組像素點(diǎn)與I1中的(Y-S)*Y個像素點(diǎn)構(gòu)成一組正方形像素點(diǎn)I2,將I2送入乘累加單元,復(fù)用后計(jì)算得到第二個中間輸出點(diǎn)MO2;
(33)在I2右側(cè)讀取第三組像素點(diǎn),所述第三組像素點(diǎn)個數(shù)為S*Y,且第三組像素點(diǎn)與I2中的(Y-S)*Y個像素點(diǎn)構(gòu)成一組正方形像素點(diǎn)I3,將I3送入乘累加單元,復(fù)用后計(jì)算得到第三個中間輸出點(diǎn)MO3;
(34)在I3正上方讀取第四組像素點(diǎn),所述第四組像素點(diǎn)個數(shù)為S*Y,且第四組像素點(diǎn)與I3中的(Y-S)*Y個像素點(diǎn)構(gòu)成一組正方形像素點(diǎn)I4,將I4送入乘累加單元,復(fù)用后計(jì)算得到第四個中間輸出點(diǎn)MO4;
(4)根據(jù)第一個中間輸出點(diǎn)MO1、第二個中間輸出點(diǎn)MO2、第三個中間輸出點(diǎn)MO3和第四個中間輸出點(diǎn)MO4求得一特征輸出點(diǎn)并存儲,具體為:MO1、MO2、MO3、MO4的值相加除以4求取平均值,或MO1、MO2、MO3、MO4取最大值;
(5)在輸入特征圖上,按從上到下、從左到右的順序,重復(fù)步驟(3)(4),得到所有特征輸出點(diǎn)并構(gòu)成一特征輸出圖。
2.根據(jù)權(quán)利要求1所述的可編程深度神經(jīng)網(wǎng)絡(luò)處理器,其特征在于:所述步驟(31)中,復(fù)用N次乘累加單元具體為:第1次采用乘累加單元進(jìn)行乘加陣列運(yùn)算后的結(jié)果送入卷積累加單元并存儲,之后每次乘加陣列運(yùn)算后的結(jié)果送入卷積累加單元并與之前存儲的值累加,直到處理完I1里的所有像素點(diǎn),得到一個中間輸出點(diǎn)MO1。
3.根據(jù)權(quán)利要求1所述的可編程深度神經(jīng)網(wǎng)絡(luò)處理器,其特征在于:所述特征圖緩存區(qū)輸出端和數(shù)據(jù)整形及復(fù)用單元間還設(shè)有一零數(shù)據(jù)跳過單元,所述零數(shù)據(jù)跳過單元用于判斷特征圖緩存區(qū)輸出端的數(shù)據(jù),若為0則不傳輸該數(shù)據(jù),若為非0值則送入數(shù)據(jù)整形及復(fù)用單元。
4.根據(jù)權(quán)利要求1所述的可編程深度神經(jīng)網(wǎng)絡(luò)處理器,其特征在于:所述層處理引擎輸出端設(shè)有自動近零數(shù)據(jù)過濾單元,所述自動近零數(shù)據(jù)過濾單元包括比較器,所述程序控制單元設(shè)置一閾值,所述比較器比較閾值和層處理引擎輸出端輸出的值,當(dāng)輸出的值低于閾值時(shí)將其置為0;所述閾值采用自適應(yīng)調(diào)整。
5.根據(jù)權(quán)利要求4所述的可編程深度神經(jīng)網(wǎng)絡(luò)處理器,其特征在于:所述自適應(yīng)調(diào)整為:首先設(shè)置初始閾值為0,進(jìn)行一次卷積處理,計(jì)算得到一值作為0閾值預(yù)測值,然后以固定步長增加閾值,每增加一次閾值重復(fù)上述步驟計(jì)算得到一輸出值,若輸出值與0閾值預(yù)測值相同,則繼續(xù)增加閾值,若不同,則將閾值恢復(fù)到上一輪值。
6.根據(jù)權(quán)利要求1所述的可編程深度神經(jīng)網(wǎng)絡(luò)處理器,其特征在于:若輸入特征圖為多張,輸出特征圖為一張,還包括以下步驟:
第一步:根據(jù)步驟(1)(2)(3)得到多張輸入特征圖對應(yīng)的四個中間輸出點(diǎn);
第二步:將所有的中間輸出點(diǎn)送入特征圖累加單元,所述特征圖累加單元將多個輸入特征圖中,對應(yīng)位置的中間輸出點(diǎn)進(jìn)行累加,得到累加后的四個點(diǎn);
第三步:根據(jù)步驟(4),由第二步得到的四個點(diǎn)求得一特征輸出點(diǎn)并存儲;
第四步:根據(jù)步驟(5)構(gòu)成一特征輸出圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于周軍,未經(jīng)周軍許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201810281984.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





