[發(fā)明專利]一種基于深度學(xué)習的目標檢測方法在審
| 申請?zhí)枺?/td> | 202010150722.0 | 申請日: | 2020-03-06 |
| 公開(公告)號: | CN111382787A | 公開(公告)日: | 2020-07-07 |
| 發(fā)明(設(shè)計)人: | 鐘靜;蔡斌 | 申請(專利權(quán))人: | 芯薇(上海)智能科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F16/55;G06N3/04;G06N3/08 |
| 代理公司: | 上海樂泓專利代理事務(wù)所(普通合伙) 31385 | 代理人: | 王瑞 |
| 地址: | 201112 上海市閔行*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 深度 學(xué)習 目標 檢測 方法 | ||
1.一種基于深度學(xué)習的目標檢測方法,其特征在于,包括如下步驟:
S100、數(shù)據(jù)收集,對需要檢測的目標進行圖片收集;
S200、算法選擇,對需要檢測的目標進行分析,選擇合適的算法;
S300、數(shù)據(jù)清洗,對收集的數(shù)據(jù)進行分析、篩選和修改,得到符合算法的模型數(shù)據(jù);
S400、數(shù)據(jù)轉(zhuǎn)換,對數(shù)據(jù)清洗后的模型數(shù)據(jù)進行轉(zhuǎn)換,轉(zhuǎn)換成模型需要的格式;
S500、模型搭建,根據(jù)選擇的算法搭建模型;
S600、模型訓(xùn)練,將轉(zhuǎn)換好的數(shù)據(jù)輸入模型中進行訓(xùn)練;
S700、模型測試,對訓(xùn)練好的生成的格式進行圖片預(yù)測;
S800、模型修護,根據(jù)測試結(jié)果對模型進行改進和維護。
2.根據(jù)權(quán)利要求1所述的一種基于深度學(xué)習的目標檢測方法,其特征在于:所述步驟S100中的數(shù)據(jù)收集具體為對需要檢測的目標進行拍攝圖片或者從互聯(lián)網(wǎng)進行搜索。
3.根據(jù)權(quán)利要求1所述的一種基于深度學(xué)習的目標檢測方法,其特征在于:所述步驟S200中的算法選擇具體為先通過數(shù)學(xué)理論、數(shù)學(xué)推算,推算出最終結(jié)果的準確率在80%以上的算法,作為我們理論上合適算法的備選算法,再對每個備選算法進行訓(xùn)練,比較準確率和召回率都高的模型作為我們算法模型。
4.根據(jù)權(quán)利要求1所述的一種基于深度學(xué)習的目標檢測方法,其特征在于:所述步驟S300中的數(shù)據(jù)清洗為根據(jù)收集的圖片的特點,對圖片進行大小統(tǒng)一調(diào)整或?qū)D片進行腐蝕和膨脹或?qū)D片進行色彩變換。
5.根據(jù)權(quán)利要求1所述的一種基于深度學(xué)習的目標檢測方法,其特征在于:所述步驟S500中的模型搭建具體為在服務(wù)器上搭建框架后輸入代碼,該代碼為匹配步驟S200中所選擇的算法的代碼。
6.根據(jù)權(quán)利要求1所述的一種基于深度學(xué)習的目標檢測方法,其特征在于:所述步驟S800中的模型修護為通過深度學(xué)習算法進行,其中深度學(xué)習算法為通過通過卷積神經(jīng)網(wǎng)絡(luò)進行卷積,提取出特征,并對特征進行預(yù)測得到預(yù)測框的面積為A,并將預(yù)測框的面積A與真實框的面積B進行比較,計算系數(shù)J,系數(shù)J越大,相關(guān)性越高。
7.根據(jù)權(quán)利要求6所述的一種基于深度學(xué)習的目標檢測方法,其特征在于:所述模型修護還需要進行位置損失函數(shù)和分類損失函數(shù)計算,
所述位置損失函數(shù)為
其中:x為真實樣本的標簽、c為預(yù)測樣本的標簽、l為預(yù)測框左上角的偏移量,g為預(yù)測框右下角的偏移量、n為樣本總數(shù)、L conf為交叉熵、α為權(quán)重系數(shù)、L loc為交叉熵;
所述分類損失函數(shù)為
其中:L loc為交叉熵、x為訓(xùn)練樣本的預(yù)測樣本、c為真實樣本數(shù)據(jù)、n為訓(xùn)練樣本總數(shù)、pos為訓(xùn)練樣本中的第幾個樣本、i為訓(xùn)練樣本中的順序編號、p為真實樣本編號、Ne為訓(xùn)練樣本中的第幾個樣本、o為真實樣本中的編號、exp為以e為底的指數(shù)、ij為默認第幾個真實樣本。
8.根據(jù)權(quán)利要求6所述的一種基于深度學(xué)習的目標檢測方法,其特征在于:所述系數(shù)J的閾值為H,當系數(shù)J小于H時,則預(yù)測框不正確,所述閾值H的設(shè)置為通過若干次隨機設(shè)置閾值來計算預(yù)測框正確的個數(shù),取其中預(yù)測框正確的個數(shù)最多的設(shè)置閾值為H。
9.根據(jù)權(quán)利要求7所述的一種基于深度學(xué)習的目標檢測方法,其特征在于:所述位置損失函數(shù)和分類損失函數(shù)小于最小值,則說明模型正確,所述位置損失函數(shù)和分類損失函數(shù)的最小值為使用梯度下降法來確定位置損失函數(shù)和分類損失函數(shù)的最小值,當位置損失函數(shù)和分類損失函數(shù)在15分鐘之內(nèi)不在變化時,位置損失函數(shù)和分類損失函數(shù)為最小值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于芯薇(上海)智能科技有限公司,未經(jīng)芯薇(上海)智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202010150722.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 根據(jù)用戶學(xué)習效果動態(tài)變化下載學(xué)習數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習服務(wù)的方法
- 漸進式學(xué)習管理方法及漸進式學(xué)習系統(tǒng)
- 輔助學(xué)習的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強化學(xué)習的自適應(yīng)移動學(xué)習路徑生成方法
- 一種線上視頻學(xué)習系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習方法、裝置及設(shè)備
- 一種學(xué)習方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習效果評測方法及系統(tǒng)





