[發(fā)明專(zhuān)利]基于自監(jiān)督學(xué)習(xí)的標(biāo)簽比例學(xué)習(xí)模型的訓(xùn)練方法和設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 202010067820.8 | 申請(qǐng)日: | 2020-01-20 |
| 公開(kāi)(公告)號(hào): | CN113139651A | 公開(kāi)(公告)日: | 2021-07-20 |
| 發(fā)明(設(shè)計(jì))人: | 劉佳斌;林宙辰 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京三星通信技術(shù)研究有限公司;三星電子株式會(huì)社 |
| 主分類(lèi)號(hào): | G06N3/08 | 分類(lèi)號(hào): | G06N3/08;G06N3/04;G06K9/62;G06F16/56;G06F16/58 |
| 代理公司: | 北京市柳沈律師事務(wù)所 11105 | 代理人: | 錢(qián)大勇 |
| 地址: | 100028 北京市朝*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 監(jiān)督 學(xué)習(xí) 標(biāo)簽 比例 模型 訓(xùn)練 方法 設(shè)備 | ||
由于弱監(jiān)督學(xué)習(xí)中的監(jiān)督信息太少,所以直接通過(guò)少量監(jiān)督信息訓(xùn)練的分類(lèi)器很難在性能上與基于監(jiān)督信息構(gòu)建的分類(lèi)器的性能相當(dāng)。本公開(kāi)旨在提出通過(guò)基于自監(jiān)督的方式來(lái)增強(qiáng)弱監(jiān)督機(jī)器學(xué)習(xí)算法的分類(lèi)性能的方法。弱監(jiān)督學(xué)習(xí)的具體體現(xiàn)之一為標(biāo)簽比例學(xué)習(xí)。一種標(biāo)簽比例學(xué)習(xí)模型的訓(xùn)練方法,包括:接收用于標(biāo)簽比例學(xué)習(xí)的弱監(jiān)督訓(xùn)練數(shù)據(jù);基于弱監(jiān)督訓(xùn)練數(shù)據(jù)來(lái)構(gòu)建監(jiān)督信息;以及通過(guò)基于多任務(wù)構(gòu)建的損失函數(shù)、采用弱監(jiān)督訓(xùn)練數(shù)據(jù)和自監(jiān)督訓(xùn)練數(shù)據(jù)來(lái)訓(xùn)練標(biāo)簽比例學(xué)習(xí)模型,其中,基于多任務(wù)構(gòu)建的損失函數(shù)為對(duì)應(yīng)于弱監(jiān)督訓(xùn)練數(shù)據(jù)的弱監(jiān)督損失函數(shù)與對(duì)應(yīng)于監(jiān)督信息的自監(jiān)督損失函數(shù)的加權(quán)和。
技術(shù)領(lǐng)域
本公開(kāi)涉及人工智能領(lǐng)域,更具體地,本公開(kāi)涉及一種基于自監(jiān)督學(xué)習(xí)的標(biāo)簽比例學(xué)習(xí)模型的訓(xùn)練方法和設(shè)備。
背景技術(shù)
標(biāo)簽比例學(xué)習(xí)(Learning from Label Proportions,LLP)是一種特殊的弱監(jiān)督分類(lèi)學(xué)習(xí)算法,其特殊性在于給定樣本中的標(biāo)簽不是以“屬性-標(biāo)簽”的形式給出,而是以組(group)或者說(shuō)包(bag)的形式組合在一起,其中,在每個(gè)包中只給出了不同類(lèi)別的比例信息。該算法的最終的目的是通過(guò)這樣的信息來(lái)獲得一個(gè)基于樣本級(jí)別的分類(lèi)器,以預(yù)測(cè)一個(gè)新樣本對(duì)應(yīng)的類(lèi)別標(biāo)簽值。
現(xiàn)有的基于標(biāo)簽比例學(xué)習(xí)算法模型中,在進(jìn)行模型更新時(shí)只使用了原有的少量的基于比例的監(jiān)督信息,導(dǎo)致無(wú)法獲得一個(gè)可以和監(jiān)督模型相媲美的模型,特別是在信息比較少時(shí),很難得到一個(gè)滿(mǎn)意的分類(lèi)器。
發(fā)明內(nèi)容
因此,本公開(kāi)的各方面提供了一種用于基于自監(jiān)督學(xué)習(xí)的標(biāo)簽比例學(xué)習(xí)模型的訓(xùn)練方法,在不進(jìn)行任何額外的數(shù)據(jù)標(biāo)注的情況下引入新的“監(jiān)督”信息進(jìn)行訓(xùn)練,從而提高模型的性能。
根據(jù)本公開(kāi)一個(gè)方面,提供了一種標(biāo)簽比例學(xué)習(xí)模型的訓(xùn)練方法,包括:訓(xùn)練數(shù)據(jù)接收步驟,接收用于標(biāo)簽比例學(xué)習(xí)的弱監(jiān)督訓(xùn)練數(shù)據(jù);監(jiān)督信息構(gòu)建步驟,基于弱監(jiān)督訓(xùn)練數(shù)據(jù)來(lái)構(gòu)建監(jiān)督信息;以及訓(xùn)練步驟,通過(guò)基于多任務(wù)構(gòu)建的損失函數(shù)、采用弱監(jiān)督訓(xùn)練數(shù)據(jù)和監(jiān)督信息來(lái)訓(xùn)練標(biāo)簽比例學(xué)習(xí)模型,其中,基于多任務(wù)構(gòu)建的損失函數(shù)是基于對(duì)應(yīng)于弱監(jiān)督訓(xùn)練數(shù)據(jù)的弱監(jiān)督損失函數(shù)與對(duì)應(yīng)于監(jiān)督信息的自監(jiān)督損失函數(shù)的。
此外,根據(jù)本公開(kāi)一個(gè)方面的訓(xùn)練方法,其中,基于多任務(wù)構(gòu)建的損失函數(shù)為對(duì)應(yīng)于弱監(jiān)督訓(xùn)練數(shù)據(jù)的弱監(jiān)督損失函數(shù)與對(duì)應(yīng)于監(jiān)督信息的自監(jiān)督損失函數(shù)的加權(quán)和。
此外,根據(jù)本公開(kāi)一個(gè)方面的訓(xùn)練方法,其中,訓(xùn)練步驟還包括:通過(guò)基于第一參數(shù)的特征提取函數(shù),對(duì)弱監(jiān)督訓(xùn)練數(shù)據(jù)和監(jiān)督信息進(jìn)行特征提取。
此外,根據(jù)本公開(kāi)一個(gè)方面的訓(xùn)練方法,其中,基于第一參數(shù)、弱監(jiān)督訓(xùn)練數(shù)據(jù)和特定于弱監(jiān)督訓(xùn)練數(shù)據(jù)的第二參數(shù)來(lái)構(gòu)建弱監(jiān)督損失函數(shù);以及基于第一參數(shù)、監(jiān)督信息和特定于監(jiān)督信息的第三參數(shù)來(lái)構(gòu)建弱監(jiān)督損失函數(shù)。
此外,根據(jù)本公開(kāi)一個(gè)方面的訓(xùn)練方法,其中,訓(xùn)練步驟還包括:同時(shí)更新第一參數(shù)、第二參數(shù)和第三參數(shù)。
此外,根據(jù)本公開(kāi)一個(gè)方面的訓(xùn)練方法,還包括:每當(dāng)針對(duì)全部弱監(jiān)督訓(xùn)練數(shù)據(jù)完成一次訓(xùn)練時(shí),則對(duì)監(jiān)督信息進(jìn)行洗牌。
此外,根據(jù)本公開(kāi)一個(gè)方面的訓(xùn)練方法,其中,監(jiān)督信息構(gòu)建步驟包括:通過(guò)去除弱監(jiān)督訓(xùn)練數(shù)據(jù)中的比例信息來(lái)獲取無(wú)監(jiān)督數(shù)據(jù);以及基于無(wú)監(jiān)督數(shù)據(jù)通過(guò)自監(jiān)督方式來(lái)構(gòu)建監(jiān)督信息。
此外,根據(jù)本公開(kāi)一個(gè)方面的訓(xùn)練方法,其中,自監(jiān)督方式之一為矩陣變換。
此外,根據(jù)本公開(kāi)一個(gè)方面的訓(xùn)練方法,其中,弱監(jiān)督損失函數(shù)之一是基于比例的交叉熵?fù)p失函數(shù)。
此外,根據(jù)本公開(kāi)一個(gè)方面的訓(xùn)練方法,其中,基于多任務(wù)構(gòu)建的損失函數(shù)中的權(quán)重用于控制弱監(jiān)督損失函數(shù)與自監(jiān)督損失函數(shù)的相對(duì)重要性。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京三星通信技術(shù)研究有限公司;三星電子株式會(huì)社,未經(jīng)北京三星通信技術(shù)研究有限公司;三星電子株式會(huì)社許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202010067820.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
- 在即時(shí)通信中提供即時(shí)監(jiān)督功能的方法及系統(tǒng)
- 一種監(jiān)督事件的生成裝置
- 一種資產(chǎn)托管監(jiān)督任務(wù)的處理方法及裝置
- 一種監(jiān)督方法及裝置
- 基于自監(jiān)督學(xué)習(xí)的標(biāo)簽比例學(xué)習(xí)模型的訓(xùn)練方法和設(shè)備
- 一種衛(wèi)生監(jiān)督對(duì)象尋址方法、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種機(jī)器人表情調(diào)用方法和家用機(jī)器人
- 計(jì)算機(jī)視覺(jué)訓(xùn)練系統(tǒng)和用于訓(xùn)練計(jì)算機(jī)視覺(jué)系統(tǒng)的方法
- 一種基于廠區(qū)智能管理系統(tǒng)的工廠設(shè)備監(jiān)督系統(tǒng)
- 信息化綜合監(jiān)督系統(tǒng)及方法
- 根據(jù)用戶(hù)學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線(xiàn)上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)
- 瀏覽器中關(guān)閉標(biāo)簽的裝置和方法
- 標(biāo)簽生成方法及標(biāo)簽生成裝置
- 一種帶有標(biāo)簽的電氣插座
- 標(biāo)簽檢測(cè)定位裝置及其標(biāo)簽制造設(shè)備
- 標(biāo)簽切割裝置及其標(biāo)簽加工機(jī)
- 基于樹(shù)形結(jié)構(gòu)的標(biāo)簽存儲(chǔ)方法及裝置
- 一種標(biāo)簽分離機(jī)構(gòu)
- 標(biāo)簽切割裝置及其標(biāo)簽加工機(jī)
- 標(biāo)簽檢測(cè)定位裝置及其標(biāo)簽制造設(shè)備
- 標(biāo)簽轉(zhuǎn)換處理方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)





