[發(fā)明專(zhuān)利]神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201911053898.8 | 申請(qǐng)日: | 2019-10-31 |
| 公開(kāi)(公告)號(hào): | CN110782034A | 公開(kāi)(公告)日: | 2020-02-11 |
| 發(fā)明(設(shè)計(jì))人: | 初祥祥;許瑞軍;張勃;李吉祥;李慶源;王斌 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京小米智能科技有限公司 |
| 主分類(lèi)號(hào): | G06N3/08 | 分類(lèi)號(hào): | G06N3/08;G06N3/04 |
| 代理公司: | 11270 北京派特恩知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人: | 王黎延;馬廣祿 |
| 地址: | 100085 北京市海淀區(qū)清河*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 子網(wǎng)絡(luò) 子結(jié)構(gòu) 網(wǎng)絡(luò)參數(shù) 備選網(wǎng)絡(luò) 網(wǎng)絡(luò) 初始化參數(shù) 目標(biāo)網(wǎng)絡(luò) 網(wǎng)絡(luò)層 訓(xùn)練神經(jīng)網(wǎng)絡(luò) 存儲(chǔ)介質(zhì) 神經(jīng)網(wǎng)絡(luò) 訓(xùn)練效率 運(yùn)算量 繼承 并列 | ||
本公開(kāi)是關(guān)于一種神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì),該方法可以包括:對(duì)超網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到超網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù),超網(wǎng)絡(luò)的每個(gè)網(wǎng)絡(luò)層包括:并列的多個(gè)備選網(wǎng)絡(luò)子結(jié)構(gòu);從超網(wǎng)絡(luò)的每個(gè)網(wǎng)絡(luò)層的多個(gè)備選網(wǎng)絡(luò)子結(jié)構(gòu)中,選擇一個(gè)備選網(wǎng)絡(luò)子結(jié)構(gòu)作為目標(biāo)網(wǎng)絡(luò)子結(jié)構(gòu);基于各層所選的目標(biāo)網(wǎng)絡(luò)子結(jié)構(gòu),構(gòu)成子網(wǎng)絡(luò);將從超網(wǎng)絡(luò)繼承的網(wǎng)絡(luò)參數(shù)作為子網(wǎng)絡(luò)的初始化參數(shù),訓(xùn)練子網(wǎng)絡(luò)得到子網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù)。本公開(kāi)中,將從超網(wǎng)絡(luò)繼承的網(wǎng)絡(luò)參數(shù)作為子網(wǎng)絡(luò)的初始化參數(shù),并訓(xùn)練子網(wǎng)絡(luò),不用針對(duì)子網(wǎng)絡(luò)從零開(kāi)始訓(xùn)練,能減少訓(xùn)練神經(jīng)網(wǎng)絡(luò)的運(yùn)算量,提高訓(xùn)練效率。
技術(shù)領(lǐng)域
本公開(kāi)涉及神經(jīng)網(wǎng)絡(luò)技術(shù)領(lǐng)域,尤其涉及一種神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)。
背景技術(shù)
神經(jīng)網(wǎng)絡(luò)是一種模仿動(dòng)物神經(jīng)網(wǎng)絡(luò)行為特征,進(jìn)行分布式并行信息處理的算法數(shù)學(xué)模型,主要依靠系統(tǒng)的復(fù)雜程度,通過(guò)調(diào)整內(nèi)部大量節(jié)點(diǎn)之間相互連接的關(guān)系,從而達(dá)到處理信息的目的。其在數(shù)據(jù)處理,例如,數(shù)據(jù)分類(lèi)、語(yǔ)音分析和圖像識(shí)別等領(lǐng)域有著廣泛的應(yīng)用。在使用神經(jīng)網(wǎng)絡(luò)之前,需要對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,而目前訓(xùn)練神經(jīng)網(wǎng)絡(luò)的方式,不僅運(yùn)算量大,且效率也很低。
發(fā)明內(nèi)容
本公開(kāi)提供一種神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)。
根據(jù)本公開(kāi)實(shí)施例的第一方面,提供一種神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法,包括:
對(duì)超網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到所述超網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù),其中,所述超網(wǎng)絡(luò)的每個(gè)網(wǎng)絡(luò)層包括:并列的多個(gè)備選網(wǎng)絡(luò)子結(jié)構(gòu);
從所述超網(wǎng)絡(luò)的每個(gè)網(wǎng)絡(luò)層的多個(gè)備選網(wǎng)絡(luò)子結(jié)構(gòu)中,選擇一個(gè)所述備選網(wǎng)絡(luò)子結(jié)構(gòu)作為目標(biāo)網(wǎng)絡(luò)子結(jié)構(gòu);
基于各層所選的所述目標(biāo)網(wǎng)絡(luò)子結(jié)構(gòu),構(gòu)成子網(wǎng)絡(luò);
將從所述超網(wǎng)絡(luò)繼承的網(wǎng)絡(luò)參數(shù)作為所述子網(wǎng)絡(luò)的初始化參數(shù),訓(xùn)練所述子網(wǎng)絡(luò)得到所述子網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù)。
可選的,所述超網(wǎng)絡(luò)包括:N個(gè)網(wǎng)絡(luò)層;每一個(gè)所述網(wǎng)絡(luò)層包括:M個(gè)備選網(wǎng)絡(luò)子結(jié)構(gòu),其中,N為不小于2的正整數(shù),M為不小于2的正整數(shù);
所述從所述超網(wǎng)絡(luò)的每個(gè)網(wǎng)絡(luò)層的多個(gè)備選網(wǎng)絡(luò)子結(jié)構(gòu)中,選擇一個(gè)所述備選網(wǎng)絡(luò)子結(jié)構(gòu)作為目標(biāo)網(wǎng)絡(luò)子結(jié)構(gòu),包括:
選擇所述超網(wǎng)絡(luò)的第n個(gè)網(wǎng)絡(luò)層的第m個(gè)備選網(wǎng)絡(luò)子結(jié)構(gòu),作為構(gòu)成所述子網(wǎng)絡(luò)的第n個(gè)網(wǎng)絡(luò)層的所述目標(biāo)網(wǎng)絡(luò)子結(jié)構(gòu),其中,n為小于或等于N的正整數(shù),m為小于或等于M的正整數(shù)。
可選的,所述方法還包括:
在得到所述超網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù)之后,對(duì)應(yīng)存儲(chǔ)各所述備選網(wǎng)絡(luò)子結(jié)構(gòu)的結(jié)構(gòu)標(biāo)識(shí)與各所述備選網(wǎng)絡(luò)子結(jié)構(gòu)的網(wǎng)絡(luò)參數(shù)之間的映射關(guān)系。
可選的,所述將從所述超網(wǎng)絡(luò)繼承的網(wǎng)絡(luò)參數(shù)作為所述子網(wǎng)絡(luò)的初始化參數(shù),訓(xùn)練所述子網(wǎng)絡(luò)得到所述子網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù),包括:
基于所述子網(wǎng)絡(luò)所包含的備選網(wǎng)絡(luò)子結(jié)構(gòu)的結(jié)構(gòu)標(biāo)識(shí),查詢(xún)所述映射關(guān)系得到對(duì)應(yīng)的備選網(wǎng)絡(luò)子結(jié)構(gòu)的網(wǎng)絡(luò)參數(shù);
基于得到的所述備選網(wǎng)絡(luò)子結(jié)構(gòu)的網(wǎng)絡(luò)參數(shù),訓(xùn)練所述子網(wǎng)絡(luò)得到所述子網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù)。
可選的,所述從所述超網(wǎng)絡(luò)的每個(gè)網(wǎng)絡(luò)層的多個(gè)備選網(wǎng)絡(luò)子結(jié)構(gòu)中,選擇一個(gè)所述備選網(wǎng)絡(luò)子結(jié)構(gòu)作為目標(biāo)網(wǎng)絡(luò)子結(jié)構(gòu),包括:
從所述超網(wǎng)絡(luò)的每個(gè)網(wǎng)絡(luò)層的多個(gè)備選網(wǎng)絡(luò)子結(jié)構(gòu)中,基于設(shè)定搜索算法選擇一個(gè)所述備選網(wǎng)絡(luò)子結(jié)構(gòu)作為目標(biāo)網(wǎng)絡(luò)子結(jié)構(gòu);
所述設(shè)定搜索算法包括以下至少之一:隨機(jī)搜索算法、貝葉斯搜索算法、進(jìn)化學(xué)習(xí)算法、強(qiáng)化學(xué)習(xí)算法、進(jìn)化和強(qiáng)化學(xué)習(xí)結(jié)合算法、以及基于梯度的算法。
可選的,所述方法還包括:
基于訓(xùn)練后的子網(wǎng)絡(luò),對(duì)輸入數(shù)據(jù)進(jìn)行數(shù)據(jù)處理;
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京小米智能科技有限公司,未經(jīng)北京小米智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201911053898.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
- 一種微電網(wǎng)電磁暫態(tài)實(shí)時(shí)仿真的方法及系統(tǒng)
- 網(wǎng)絡(luò)切片子網(wǎng)的選擇方法及裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)切片的管理方法及系統(tǒng)和存儲(chǔ)介質(zhì)
- 用于雙向網(wǎng)絡(luò)地理信息傳送的系統(tǒng)、方法及設(shè)備
- 多跳異構(gòu)無(wú)線網(wǎng)絡(luò)中多任務(wù)路由的方法、網(wǎng)絡(luò)及節(jié)點(diǎn)
- 基于高精度神經(jīng)網(wǎng)絡(luò)的圖像處理方法、裝置及電子設(shè)備
- 一種前向耗時(shí)的確定方法、裝置及設(shè)備
- 超網(wǎng)絡(luò)參數(shù)更新方法、裝置和電子設(shè)備
- 一種基于網(wǎng)絡(luò)分解的大規(guī)模橋梁網(wǎng)絡(luò)連通概率評(píng)估方法
- 電信網(wǎng)絡(luò)
- 確定網(wǎng)絡(luò)參數(shù)
- 基于終端和網(wǎng)絡(luò)信息融合的無(wú)線網(wǎng)絡(luò)切換方法
- 網(wǎng)絡(luò)業(yè)務(wù)質(zhì)量參數(shù)識(shí)別方法及裝置
- 一種無(wú)線設(shè)備網(wǎng)絡(luò)參數(shù)的確認(rèn)方法
- 網(wǎng)絡(luò)接入方法和裝置
- 網(wǎng)絡(luò)參數(shù)配置方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種網(wǎng)絡(luò)流量配置方法及裝置
- 一種基于灰色模型預(yù)測(cè)目標(biāo)網(wǎng)絡(luò)參數(shù)的方法和裝置
- 網(wǎng)絡(luò)接入方法、裝置及存儲(chǔ)介質(zhì)
- 網(wǎng)絡(luò)參數(shù)調(diào)整方法和裝置
- 一種對(duì)網(wǎng)絡(luò)廣告的多個(gè)備選版本選擇發(fā)布的方法和裝置
- 用于在3GPP LTE網(wǎng)絡(luò)與備選無(wú)線網(wǎng)絡(luò)之間執(zhí)行切換過(guò)程的方法和設(shè)備
- 網(wǎng)絡(luò)流量的分配方法
- 一種重新注冊(cè)網(wǎng)絡(luò)的方法、裝置及終端
- 用于分配備選網(wǎng)絡(luò)接入資源的系統(tǒng)和方法
- 用于用保留價(jià)分配和定價(jià)備選網(wǎng)絡(luò)接入資源的系統(tǒng)和方法
- 飛針測(cè)試的基準(zhǔn)網(wǎng)絡(luò)選取方法和裝置
- 一種區(qū)域軌道交通網(wǎng)絡(luò)化開(kāi)行方案?jìng)溥x集制定方法
- 一種基于智能電網(wǎng)的異構(gòu)網(wǎng)絡(luò)接入選擇方法及相關(guān)設(shè)備
- 網(wǎng)絡(luò)切片下基于主動(dòng)探測(cè)的虛擬網(wǎng)資源分配方法





