[發(fā)明專利]具有深度學(xué)習(xí)特征的指數(shù)建模在審
| 申請(qǐng)?zhí)枺?/td> | 201911036166.8 | 申請(qǐng)日: | 2019-10-29 |
| 公開(kāi)(公告)號(hào): | CN110796190A | 公開(kāi)(公告)日: | 2020-02-14 |
| 發(fā)明(設(shè)計(jì))人: | M.溫特勞布;A.T.蘇雷什;E.瓦里亞尼 | 申請(qǐng)(專利權(quán))人: | 谷歌有限責(zé)任公司 |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62;G06N3/04;G06N3/08;G06N20/00 |
| 代理公司: | 11105 北京市柳沈律師事務(wù)所 | 代理人: | 金玉潔 |
| 地址: | 美國(guó)加利*** | 國(guó)省代碼: | 美國(guó);US |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 映射 輸出結(jié)構(gòu) 機(jī)器學(xué)習(xí)模型 特征發(fā)現(xiàn)功能 最大熵模型 機(jī)器學(xué)習(xí) 結(jié)構(gòu)性質(zhì) 精度損失 協(xié)同組合 壓縮機(jī)器 指數(shù)模型 資源受限 壓縮 嵌入 場(chǎng)景 輸出 分類 網(wǎng)絡(luò) 開(kāi)發(fā) 學(xué)習(xí) | ||
本公開(kāi)的各方面使得人為指定的關(guān)系能夠有助于實(shí)現(xiàn)映射,該映射使得能夠壓縮機(jī)器學(xué)習(xí)模型的輸出結(jié)構(gòu)。諸如最大熵模型的指數(shù)模型可以利用機(jī)器學(xué)習(xí)嵌入和映射來(lái)產(chǎn)生分類輸出。以這種方式,可以將機(jī)器學(xué)習(xí)模型(例如,深度網(wǎng)絡(luò))的特征發(fā)現(xiàn)功能與基于人類對(duì)待解決問(wèn)題的結(jié)構(gòu)性質(zhì)的理解而開(kāi)發(fā)的關(guān)系進(jìn)行協(xié)同組合,從而使得能夠壓縮模型輸出結(jié)構(gòu),而沒(méi)有明顯的精度損失。這些壓縮模型提高了“設(shè)備上”或其他資源受限場(chǎng)景的適用性。
優(yōu)先權(quán)要求
本申請(qǐng)要求于2018年10月29日提交的標(biāo)題為“Exponential Modeling with DeepLearning Features”的美國(guó)專利申請(qǐng)序列號(hào)62/752,128的優(yōu)先權(quán),其全部公開(kāi)內(nèi)容通過(guò)引用合并于此。
技術(shù)領(lǐng)域
本公開(kāi)總體上涉及機(jī)器學(xué)習(xí)。更具體地,本公開(kāi)涉及機(jī)器學(xué)習(xí)模型,包括利用輸出類別和嵌入?yún)?shù)之間的映射以提供壓縮增益的指數(shù)模型(例如,最大熵模型)。
背景技術(shù)
各種形式的機(jī)器學(xué)習(xí)模型已經(jīng)徹底改變了機(jī)器智能的許多領(lǐng)域。作為一個(gè)早期的示例,在過(guò)去的某個(gè)時(shí)刻,最大熵模型在自然語(yǔ)言處理和其他技術(shù)領(lǐng)域提供了最先進(jìn)的性能。最大熵模型遵循以下原則:模型應(yīng)根據(jù)給定信息提供盡可能少的偏差估計(jì);也就是說(shuō),對(duì)于丟失信息最大程度地不置可否。然而,最近,人工神經(jīng)網(wǎng)絡(luò)(“神經(jīng)網(wǎng)絡(luò)”)已為包括自然語(yǔ)言處理在內(nèi)的許多問(wèn)題領(lǐng)域提供了最先進(jìn)的解決方案。取代最大熵建模作為學(xué)習(xí)算法的一個(gè)主要原因是最大熵模型要使用的特征是手工的,而不是自動(dòng)學(xué)習(xí)的。
神經(jīng)網(wǎng)絡(luò)是一類機(jī)器學(xué)習(xí)模型,特別強(qiáng)大、準(zhǔn)確或高效執(zhí)行各種任務(wù)。神經(jīng)網(wǎng)絡(luò)可以包括一組連接節(jié)點(diǎn),也可以被稱為(人工)神經(jīng)元或感知器。神經(jīng)網(wǎng)絡(luò)可以被組織成一層或多層。神經(jīng)網(wǎng)絡(luò)的節(jié)點(diǎn)可以與邊連接,并且權(quán)重可以與每個(gè)邊相關(guān)聯(lián)。
包含多層的神經(jīng)網(wǎng)絡(luò)可以被稱為“深度”網(wǎng)絡(luò)。深度網(wǎng)絡(luò)可以包括輸入層、輸出層以及位于輸入層和輸出層之間的一個(gè)或多個(gè)隱藏層。神經(jīng)網(wǎng)絡(luò)的節(jié)點(diǎn)可以完全連接或不完全連接。示例神經(jīng)網(wǎng)絡(luò)包括前饋神經(jīng)網(wǎng)絡(luò)、遞歸神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、其他形式的人工神經(jīng)網(wǎng)絡(luò)或其組合。
如今,無(wú)數(shù)的應(yīng)用都使用了各種機(jī)器學(xué)習(xí)模型,諸如神經(jīng)網(wǎng)絡(luò)。然而,它們的準(zhǔn)確性部分源于具有大量參數(shù),這些參數(shù)會(huì)導(dǎo)致較高的計(jì)算和內(nèi)存開(kāi)銷。作為一個(gè)示例,典型的神經(jīng)網(wǎng)絡(luò)可能包括大量的權(quán)重(例如,一萬(wàn)到一千萬(wàn)到一億),這些權(quán)重都可以具有唯一的值。存儲(chǔ)和運(yùn)行神經(jīng)網(wǎng)絡(luò)通常需要存儲(chǔ)這些值中的每一個(gè),并且使用這些值中的每一個(gè)執(zhí)行數(shù)學(xué)運(yùn)算,這需要大量的存儲(chǔ)器和處理器使用。
在使用機(jī)器學(xué)習(xí)模型作為分類器將輸入分類為大量不同的可能類別的情況下,此問(wèn)題會(huì)更加嚴(yán)重。特別地,用作分類器的機(jī)器學(xué)習(xí)模型通常將具有輸出層(例如,softmax層)或其他輸出結(jié)構(gòu),為每個(gè)可用類別提供相應(yīng)輸出值,對(duì)于特定任務(wù),這可能是非常大的數(shù)量。作為一個(gè)示例,用于執(zhí)行“下一個(gè)單詞預(yù)測(cè)”或其他自然語(yǔ)言處理任務(wù)的神經(jīng)網(wǎng)絡(luò)通常會(huì)具有輸出層,其包括的節(jié)點(diǎn)數(shù)量等于在與分類器相關(guān)的詞匯表中包括的單詞數(shù)量,在某些情況下可能包括大約一百萬(wàn)個(gè)單詞。由于手機(jī)上當(dāng)前不適合使用較大的詞匯量,因此手機(jī)上的當(dāng)前應(yīng)用將詞匯量減少到數(shù)萬(wàn)個(gè)單詞。駐留在云中的服務(wù)器上的模型在應(yīng)用的詞匯表中可能有數(shù)百萬(wàn)個(gè)單詞。因此,在這些情況下,超大比例的網(wǎng)絡(luò)參數(shù)可以位于網(wǎng)絡(luò)和相關(guān)結(jié)構(gòu)的輸出層中。
此外,隨著網(wǎng)絡(luò)和硬件變得更好和更快,許多計(jì)算都轉(zhuǎn)移到了“設(shè)備上”范式,其中機(jī)器學(xué)習(xí)模型在嵌入式設(shè)備、用戶設(shè)備、邊緣設(shè)備或其他形式的“資源受限”設(shè)備上被本地存儲(chǔ)和實(shí)現(xiàn),從而提供了更快的響應(yīng)時(shí)間以及更好的安全性和隱私保證。特別是,如果可以在移動(dòng)設(shè)備和其他資源受限的設(shè)備(諸如智能設(shè)備或嵌入式設(shè)備)上存儲(chǔ)和運(yùn)行這些網(wǎng)絡(luò)(并因此獲得其準(zhǔn)確性益處),將是有益的。然而,由于存儲(chǔ)和運(yùn)行網(wǎng)絡(luò)需要大量計(jì)算資源(諸如處理資源和存儲(chǔ)器資源),它們?cè)谫Y源受限環(huán)境/設(shè)備中的使用受到一定程度的限制。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于谷歌有限責(zé)任公司,未經(jīng)谷歌有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201911036166.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:二維空間點(diǎn)的聚類方法
- 下一篇:軌跡分類方法及裝置
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 機(jī)器學(xué)習(xí)模型之間進(jìn)行轉(zhuǎn)換的方法與設(shè)備
- 在多個(gè)機(jī)器學(xué)習(xí)任務(wù)上訓(xùn)練機(jī)器學(xué)習(xí)模型
- 用于訓(xùn)練機(jī)器學(xué)習(xí)模型的方法及系統(tǒng)
- 機(jī)器學(xué)習(xí)模型解釋方法以及裝置
- 用于機(jī)器學(xué)習(xí)模型的并行化坐標(biāo)下降法
- 一種機(jī)器學(xué)習(xí)模型的生成方法、裝置
- 模型配置方法、裝置、電子設(shè)備及可讀取存儲(chǔ)介質(zhì)
- 基于區(qū)塊鏈網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)模型處理方法及節(jié)點(diǎn)
- 模型優(yōu)化方法、裝置、存儲(chǔ)介質(zhì)及服務(wù)器
- 管理應(yīng)用的方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 群組推薦方法和系統(tǒng)
- 提供嬰幼兒體格測(cè)量服務(wù)的系統(tǒng)及數(shù)據(jù)傳輸方法
- 資料保護(hù)系統(tǒng)及方法
- 一種基于進(jìn)程行為特征發(fā)現(xiàn)竊密木馬的方法及系統(tǒng)
- 一種基于交易網(wǎng)絡(luò)節(jié)點(diǎn)的可疑特征發(fā)現(xiàn)方法
- 基于QoS特征發(fā)現(xiàn)的云計(jì)算節(jié)能調(diào)度實(shí)現(xiàn)方法
- 用于新穎特征發(fā)現(xiàn)的自主學(xué)習(xí)平臺(tái)
- 專有鏈路管理器特征發(fā)現(xiàn)和交換
- 一種手勢(shì)誤識(shí)特征發(fā)現(xiàn)方法
- 一種智能化的足跡特征發(fā)現(xiàn)與采集平臺(tái)





