[發(fā)明專利]一種手勢識(shí)別方法在審
| 申請?zhí)枺?/td> | 202011485807.0 | 申請日: | 2020-12-16 |
| 公開(公告)號: | CN112507918A | 公開(公告)日: | 2021-03-16 |
| 發(fā)明(設(shè)計(jì))人: | 鐘浩;伍廣彬;言宏亮;曹晟;于波;張華;楊波;梁興偉;楊衛(wèi)國 | 申請(專利權(quán))人: | 康佳集團(tuán)股份有限公司;深圳市格靈人工智能與機(jī)器人研究院有限公司;哈爾濱工業(yè)大學(xué)(深圳);深圳哈工大科技創(chuàng)新產(chǎn)業(yè)發(fā)展有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/08 |
| 代理公司: | 深圳市君勝知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44268 | 代理人: | 陳專 |
| 地址: | 518057 廣東省深圳市南山區(qū)粵海街*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 手勢 識(shí)別 方法 | ||
本發(fā)明公開了一種手勢識(shí)別方法,方法包括:獲取視頻文件中的第t幀圖像;將第t幀圖像輸入已訓(xùn)練的手勢識(shí)別模型,并控制手勢識(shí)別模型對第t幀圖像進(jìn)行手勢識(shí)別,得到第t幀圖像對應(yīng)的圖像手勢;當(dāng)圖像手勢為靜態(tài)手勢類型時(shí),將圖像手勢作為目標(biāo)手勢;當(dāng)圖像手勢為動(dòng)態(tài)手勢類型時(shí),迭代獲取視頻文件中的幀圖像,并根據(jù)幀圖像對應(yīng)的圖像手勢,確定視頻文件對應(yīng)的目標(biāo)手勢;根據(jù)目標(biāo)手勢,確定視頻文件對應(yīng)的手勢指令。本發(fā)明通過對手勢模型的優(yōu)化以及動(dòng)態(tài)手勢類型和靜態(tài)手勢類型識(shí)別的結(jié)合,提高在對手勢識(shí)別精確度。
技術(shù)領(lǐng)域
本發(fā)明涉及生物識(shí)別技術(shù)領(lǐng)域,尤其涉及一種手勢識(shí)別方法。
背景技術(shù)
隨著計(jì)算機(jī)視覺技術(shù)的快速發(fā)展,人機(jī)交互在各個(gè)領(lǐng)域應(yīng)用也越來越廣泛。手勢是一種直觀、自然且快速地與計(jì)算機(jī)進(jìn)行通信的交互技術(shù)。因此,手勢識(shí)別技術(shù)也是目前人機(jī)交互技術(shù)中研究的重點(diǎn)方向之一。目前,手勢識(shí)別技術(shù)已普遍應(yīng)用于各種智能終端中,通過手勢控制終端完成相應(yīng)的功能操作,可實(shí)現(xiàn)對智能終端自然靈活的操作,增強(qiáng)操作的簡便性及用戶的體驗(yàn)度。然而,手勢識(shí)別技術(shù)也依然存在一定的瓶頸,如何在基于大分辨圖像下并且處于復(fù)雜的環(huán)境背景中快速準(zhǔn)確的識(shí)別手勢,以讓智能終端實(shí)時(shí)響應(yīng)完成相應(yīng)的功能,這也是目前手勢識(shí)別技術(shù)研究的一個(gè)熱點(diǎn)問題和難點(diǎn)問題。
目前應(yīng)用于手勢識(shí)別的方式主要有三種,第一種是采用機(jī)器學(xué)習(xí)方法,利用傳統(tǒng)圖像處理方法對攝取圖像進(jìn)行預(yù)處理,然后對手勢進(jìn)行分割以及定位,最后設(shè)計(jì)分類器對手勢進(jìn)行分類,分類出相應(yīng)的手勢;第二種是采用深度學(xué)習(xí)方法,先通過CNN(Convolutional Neural Networks,簡稱CNN)網(wǎng)絡(luò)回歸定位出人,然后在檢測到人的基礎(chǔ)上再設(shè)計(jì)一個(gè)CNN網(wǎng)絡(luò)對手勢進(jìn)行定位與分類,從而確定手勢類型;第三種同樣也是利用深度學(xué)習(xí)思想設(shè)計(jì)CNN網(wǎng)絡(luò)直接檢測出手部骨骼的關(guān)鍵點(diǎn),然后利用關(guān)鍵點(diǎn)位置關(guān)系,進(jìn)而可以判別每個(gè)手勢的類別。
對于方法一,在復(fù)雜場景或者大分辨圖像背景下,雖然這種方法速度快,但是魯棒性差,準(zhǔn)確率低,難以滿足實(shí)際應(yīng)用;對于方法二,通過設(shè)計(jì)CNN網(wǎng)絡(luò)先定位人,在對手勢進(jìn)行定位與分類識(shí)別,此種方法對于大分辨圖像以及復(fù)雜場景下,能保證較高的識(shí)別精度,穩(wěn)定性高,但是這種方法往往在嵌入式設(shè)備上速度往往較慢,硬件內(nèi)存消耗大,不利于量產(chǎn)使用。而對于方法三,在大分辨率圖像下,由于手部占整個(gè)圖像的比例比較小,往往會(huì)導(dǎo)致漏檢,從而導(dǎo)致整個(gè)識(shí)別的精度不高,另外,在復(fù)雜場景下,這種方法也會(huì)把一些背景納入手勢識(shí)別的范圍,從而導(dǎo)致手勢誤檢。
發(fā)明內(nèi)容
本發(fā)明的主要目的在于提供一種手勢識(shí)別方法、智能終端及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),旨在解決現(xiàn)有技術(shù)中手勢識(shí)別準(zhǔn)確率低的問題。
為實(shí)現(xiàn)上述目的,本發(fā)明提供一種手勢識(shí)別方法,所述手勢識(shí)別方法包括如下步驟:
獲取視頻文件中的第t幀圖像,其中,t為正整數(shù);
將所述第t幀圖像輸入已訓(xùn)練的手勢識(shí)別模型,并控制所述手勢識(shí)別模型對所述第t幀圖像進(jìn)行手勢識(shí)別,得到所述第t幀圖像對應(yīng)的圖像手勢;
當(dāng)所述圖像手勢為靜態(tài)手勢類型時(shí),將所述圖像手勢作為目標(biāo)手勢;
當(dāng)所述圖像手勢為動(dòng)態(tài)手勢類型時(shí),迭代獲取所述視頻文件中的幀圖像,并根據(jù)所述幀圖像對應(yīng)的圖像手勢,確定所述視頻文件對應(yīng)的目標(biāo)手勢;
根據(jù)所述目標(biāo)手勢,確定所述視頻文件對應(yīng)的手勢指令。
可選地,所述的手勢識(shí)別方法,其中,所述手勢識(shí)別模型包括基于預(yù)設(shè)的神經(jīng)網(wǎng)絡(luò)訓(xùn)練得到的模型,所述神經(jīng)網(wǎng)絡(luò)的主干網(wǎng)絡(luò)為輕量級神經(jīng)網(wǎng)絡(luò);所述輕量級神經(jīng)網(wǎng)絡(luò)包括網(wǎng)絡(luò)擴(kuò)張系數(shù)為小于六倍的MobileNet2網(wǎng)絡(luò)。
可選地,所述的手勢識(shí)別方法,其中,所述手勢識(shí)別模型的訓(xùn)練過程包括:
獲取訓(xùn)練樣本集,并對所述訓(xùn)練樣本集進(jìn)行標(biāo)注,得到所述訓(xùn)練樣本集中各個(gè)訓(xùn)練圖像對應(yīng)的標(biāo)注信息;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于康佳集團(tuán)股份有限公司;深圳市格靈人工智能與機(jī)器人研究院有限公司;哈爾濱工業(yè)大學(xué)(深圳);深圳哈工大科技創(chuàng)新產(chǎn)業(yè)發(fā)展有限公司,未經(jīng)康佳集團(tuán)股份有限公司;深圳市格靈人工智能與機(jī)器人研究院有限公司;哈爾濱工業(yè)大學(xué)(深圳);深圳哈工大科技創(chuàng)新產(chǎn)業(yè)發(fā)展有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202011485807.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





