[發(fā)明專利]神經(jīng)網(wǎng)絡(luò)的動(dòng)態(tài)裁剪方法、裝置及存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 201710656730.0 | 申請(qǐng)日: | 2017-08-03 |
| 公開(公告)號(hào): | CN109389216B | 公開(公告)日: | 2021-06-18 |
| 發(fā)明(設(shè)計(jì))人: | 南楠;李曉會(huì);葉麗萍 | 申請(qǐng)(專利權(quán))人: | 珠海全志科技股份有限公司 |
| 主分類號(hào): | G06N3/08 | 分類號(hào): | G06N3/08 |
| 代理公司: | 工業(yè)和信息化部電子專利中心 11010 | 代理人: | 齊潔茹 |
| 地址: | 519085 廣東省*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 神經(jīng)網(wǎng)絡(luò) 動(dòng)態(tài) 裁剪 方法 裝置 存儲(chǔ) 介質(zhì) | ||
本發(fā)明公開了一種神經(jīng)網(wǎng)絡(luò)的動(dòng)態(tài)裁剪方法、裝置及存儲(chǔ)介質(zhì),所述方法包括:設(shè)定裁剪率目標(biāo)、裁剪范圍、裁剪對(duì)象及裁剪階段個(gè)數(shù);根據(jù)所述裁剪率目標(biāo)和裁剪階段個(gè)數(shù),確定每個(gè)裁剪階段的裁剪率目標(biāo);根據(jù)神經(jīng)網(wǎng)絡(luò)原始模型的網(wǎng)絡(luò)訓(xùn)練參數(shù)和所述裁剪階段個(gè)數(shù),確定每個(gè)裁剪階段的網(wǎng)絡(luò)訓(xùn)練參數(shù);基于每個(gè)裁剪階段的網(wǎng)絡(luò)訓(xùn)練參數(shù),按裁剪階段進(jìn)行網(wǎng)絡(luò)訓(xùn)練,并在每個(gè)裁剪階段中,根據(jù)對(duì)應(yīng)裁剪階段的裁剪率目標(biāo),對(duì)所述裁剪范圍內(nèi)的所述裁剪對(duì)象進(jìn)行裁剪。采用本發(fā)明所述方案,在能夠確保神經(jīng)網(wǎng)絡(luò)精度的同時(shí)取得較好的壓縮和加速效果,并且收斂較快,訓(xùn)練效率高。
技術(shù)領(lǐng)域
本發(fā)明涉及深度學(xué)習(xí)技術(shù)領(lǐng)域,尤其涉及一種神經(jīng)網(wǎng)絡(luò)的動(dòng)態(tài)裁剪方法、裝置及存儲(chǔ)介質(zhì)。
背景技術(shù)
近年來,隨著人工智能技術(shù)的迅猛發(fā)展,深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)在模式識(shí)別方面取得了巨大的成功,例如圖像分類、目標(biāo)檢測、圖像分割、語音識(shí)別以及機(jī)器翻譯等。在上述領(lǐng)域中,深度學(xué)習(xí)模型的性能遠(yuǎn)超傳統(tǒng)的淺度模型,甚至在某些方面達(dá)到了人類的水準(zhǔn)。然而,性能較好的神經(jīng)網(wǎng)絡(luò)通常具有較大的模型參數(shù),使得其計(jì)算復(fù)雜度較高。這里,計(jì)算的復(fù)雜度同時(shí)體現(xiàn)在空間(龐大的模型存儲(chǔ)體積和運(yùn)行時(shí)的內(nèi)存占用)和時(shí)間(單次推理所需數(shù)百億次浮點(diǎn)運(yùn)算)兩方面上。因此,對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行壓縮和加速變得尤為重要,特別是對(duì)運(yùn)行在諸如嵌入式設(shè)備、集成硬件設(shè)備以及大規(guī)模數(shù)據(jù)處理中心上的應(yīng)用來說。
當(dāng)前,主流的壓縮和加速深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的方法是網(wǎng)絡(luò)裁剪,例如,Han,Song等人發(fā)表的論文“Learning both weights and connections for efficient neuralnetwork”提出了一種針對(duì)深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)逐次迭代的靜態(tài)裁剪策略,其壓縮率可觀,性能下降有限,但訓(xùn)練時(shí)間過長,效率太低;Guo,Yiwen等人發(fā)表的論文“Dynamic NetworkSurgery for Efficient DNNs”提出了一種針對(duì)深度學(xué)習(xí)網(wǎng)絡(luò)的動(dòng)態(tài)裁剪策略,其訓(xùn)練時(shí)間較短,但壓縮率不可控,性能下降較多。因此,目前的網(wǎng)絡(luò)裁剪技術(shù)效果不理想,仍然存在著訓(xùn)練時(shí)間、壓縮率與網(wǎng)絡(luò)性能不能同時(shí)兼顧的技術(shù)問題。
發(fā)明內(nèi)容
鑒于上述問題,提出了本發(fā)明以便提供一種解決上述問題的神經(jīng)網(wǎng)絡(luò)的動(dòng)態(tài)裁剪方法、裝置及存儲(chǔ)介質(zhì)。
依據(jù)本發(fā)明的一個(gè)方面,提供一種神經(jīng)網(wǎng)絡(luò)的動(dòng)態(tài)裁剪方法,包括:
設(shè)定裁剪率目標(biāo)、裁剪范圍、裁剪對(duì)象及裁剪階段個(gè)數(shù);
根據(jù)所述裁剪率目標(biāo)和裁剪階段個(gè)數(shù),確定每個(gè)裁剪階段的裁剪率目標(biāo);
根據(jù)神經(jīng)網(wǎng)絡(luò)原始模型的網(wǎng)絡(luò)訓(xùn)練參數(shù)和所述裁剪階段個(gè)數(shù),確定每個(gè)裁剪階段的網(wǎng)絡(luò)訓(xùn)練參數(shù);
基于每個(gè)裁剪階段的網(wǎng)絡(luò)訓(xùn)練參數(shù),按裁剪階段進(jìn)行網(wǎng)絡(luò)訓(xùn)練,并在每個(gè)裁剪階段中,根據(jù)對(duì)應(yīng)裁剪階段的裁剪率目標(biāo),對(duì)所述裁剪范圍內(nèi)的所述裁剪對(duì)象進(jìn)行裁剪。
可選地,本發(fā)明所述方法中,所述裁剪對(duì)象包括如下對(duì)象之一:權(quán)重的連接、濾波器和卷積核。
可選地,本發(fā)明所述方法中,所述根據(jù)神經(jīng)網(wǎng)絡(luò)原始模型的網(wǎng)絡(luò)訓(xùn)練參數(shù)和所述裁剪階段個(gè)數(shù),確定每個(gè)裁剪階段的網(wǎng)絡(luò)訓(xùn)練參數(shù),包括:
根據(jù)神經(jīng)網(wǎng)絡(luò)原始模型的訓(xùn)練迭代次數(shù)以及所述裁剪階段數(shù)量,確定每個(gè)裁剪階段的訓(xùn)練迭代次數(shù);
根據(jù)神經(jīng)網(wǎng)絡(luò)原始模型的訓(xùn)練迭代次數(shù)、訓(xùn)練參數(shù)以及每個(gè)裁剪階段前裁剪累計(jì)訓(xùn)練迭代次數(shù),確定每個(gè)裁剪階段的初始化訓(xùn)練參數(shù)。
可選地,本發(fā)明所述方法中,確定的每個(gè)裁剪階段的訓(xùn)練迭代次數(shù)為Mi,所述Mi=α×M/N;其中,M為原始訓(xùn)練迭代次數(shù),N為裁剪階段的個(gè)數(shù),α為設(shè)置的迭代次數(shù)影響因子,1≤i≤N。
可選地,本發(fā)明所述方法中,所述根據(jù)神經(jīng)網(wǎng)絡(luò)原始模型的訓(xùn)練迭代次數(shù)、訓(xùn)練參數(shù)以及每個(gè)裁剪階段前裁剪累計(jì)訓(xùn)練迭代次數(shù),確定每個(gè)裁剪階段的初始化訓(xùn)練參數(shù),包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于珠海全志科技股份有限公司,未經(jīng)珠海全志科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201710656730.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲(chǔ)介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置
- 動(dòng)態(tài)矢量譯碼方法和動(dòng)態(tài)矢量譯碼裝置
- 動(dòng)態(tài)口令的顯示方法及動(dòng)態(tài)令牌
- 動(dòng)態(tài)庫管理方法和裝置
- 動(dòng)態(tài)令牌的身份認(rèn)證方法及裝置
- 令牌、動(dòng)態(tài)口令生成方法、動(dòng)態(tài)口令認(rèn)證方法及系統(tǒng)
- 一種動(dòng)態(tài)模糊控制系統(tǒng)
- 一種基于動(dòng)態(tài)信號(hào)的POS機(jī)和安全保護(hù)方法
- 圖像動(dòng)態(tài)展示的方法、裝置、系統(tǒng)及介質(zhì)
- 一種基于POS機(jī)聚合碼功能分離顯示動(dòng)態(tài)聚合碼的系統(tǒng)
- 基于動(dòng)態(tài)口令的身份認(rèn)證方法、裝置和動(dòng)態(tài)令牌
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





