[發明專利]行人重識別的噪聲樣本識別方法、裝置、設備和存儲介質有效
| 申請號: | 202010186361.5 | 申請日: | 2020-03-17 |
| 公開(公告)號: | CN111414952B | 公開(公告)日: | 2023-10-17 |
| 發明(設計)人: | 程昊;蔣忻洋;李珂;孫星;余宗橋;彭湃;郭曉威;黃小明;黃飛躍;吳永堅 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06V10/774 | 分類號: | G06V10/774;G06V10/74;G06V10/771;G06V10/82;G06V10/762;G06N3/0464;G06N3/084;G06V40/10 |
| 代理公司: | 華進聯合專利商標代理有限公司 44224 | 代理人: | 于麗君 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 行人 識別 噪聲 樣本 方法 裝置 設備 存儲 介質 | ||
一種行人重識別的噪聲樣本識別方法、裝置、設備和存儲介質,所述方法包括:對行人重識別的各初始樣本進行特征提取,獲得各初始樣本的樣本特征;根據各樣本特征,確定目標樣本組的組內樣本特征中心,以及目標樣本組內的各初始樣本的樣本距離,目標樣本組包括至少兩個初始樣本,樣本距離為初始樣本的樣本特征與初始樣本所在目標樣本組的組內樣本特征中心之間的距離;根據目標樣本組的各初始樣本的樣本距離,確定目標樣本組中的各初始樣本是否為噪聲樣本;將確定為噪聲樣本的初始樣本移除,獲得更新后的樣本數據;根據更新后的樣本數據對預設神經網絡進行網絡訓練,獲得訓練確定的行人重識別模型。通過上述方法獲得的行人重識別模型的準確度更高。
技術領域
本申請涉及計算機技術領域,特別是涉及一種行人重識別的噪聲樣本識別方法、裝置、計算機設備和存儲介質。
背景技術
在機器學習的領域中,需要攜帶標注信息的樣本來訓練模型,而樣本的標注信息通常是由所屬領域的經驗豐富的人員對樣本進行標注得到的,其中也有可能存在標注失誤的情況,這一標注失誤的樣本稱為噪聲樣本;為了使用于訓練模型的樣本更好,可以采用一些方法識別出樣本中的噪聲樣本。
通常認為噪聲標簽對應樣本的loss(損失)傾向于比非噪聲樣本的loss要大,在例如圖像分類問題中主要根據網絡輸出層(FC層)的損失(loss)來鑒別噪聲樣本數據;然而,在一些具體應用場景中,例如行人重識別(ReID),ID的數量很多,而每個ID內的樣本數據量較少,通過上述方法網絡輸出層容易過擬合,利用樣本的loss無法區分出噪聲樣本和非噪聲樣本,進而用包含噪聲樣本的樣本數據進行行人重識別模型的訓練,獲得的模型識別準確度較低。
發明內容
基于此,有必要針對上述技術問題,提供一種能夠獲得識別準確度更高的行人重識別模型的行人重識別的噪聲樣本識別方法、裝置、設備和存儲介質。
一種行人重識別的噪聲樣本識別方法,所述方法包括:
對行人重識別的各初始樣本進行特征提取,獲得各所述初始樣本的樣本特征;
根據各所述樣本特征,確定目標樣本組的組內樣本特征中心,以及所述目標樣本組內的各初始樣本的樣本距離,所述目標樣本組包括至少兩個所述初始樣本,所述樣本距離為所述初始樣本的樣本特征與所述初始樣本所在目標樣本組的組內樣本特征中心之間的距離;
根據所述目標樣本組的各初始樣本的樣本距離,確定所述目標樣本組中的各所述初始樣本是否為噪聲樣本;
將確定為所述噪聲樣本的初始樣本移除,獲得更新后的樣本數據;
根據所述更新后的樣本數據對第一預設神經網絡進行網絡訓練,獲得訓練確定的行人重識別模型。
一種行人重識別的噪聲樣本識別裝置,所述裝置包括:
特征提取模塊,用于對行人重識別的各初始樣本進行特征提取,獲得各所述初始樣本的樣本特征;
樣本距離確定模塊,用于根據各所述樣本特征,確定目標樣本組的組內樣本特征中心,以及所述目標樣本組內的各初始樣本的樣本距離,所述目標樣本組包括至少兩個所述初始樣本,所述樣本距離為所述初始樣本的樣本特征與所述初始樣本所在目標樣本組的組內樣本特征中心之間的距離;
噪聲樣本識別模塊,用于根據所述目標樣本組的各初始樣本的樣本距離,確定所述目標樣本組中的各所述初始樣本是否為噪聲樣本;
樣本更新模塊,用于將確定為噪聲樣本的初始樣本移除,獲得更新后的樣本數據;
模型訓練模塊,用于根據所述更新后的樣本數據對第一預設神經網絡進行網絡訓練,獲得訓練確定的行人重識別模型。
一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,所述處理器執行所述計算機程序時實現以下步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202010186361.5/2.html,轉載請聲明來源鉆瓜專利網。





