[發(fā)明專利]目標(biāo)檢測方法和目標(biāo)檢測裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201710348872.0 | 申請(qǐng)日: | 2017-05-17 |
| 公開(公告)號(hào): | CN108875763A | 公開(公告)日: | 2018-11-23 |
| 發(fā)明(設(shè)計(jì))人: | 張弛 | 申請(qǐng)(專利權(quán))人: | 北京曠視科技有限公司;北京邁格威科技有限公司 |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62;G06N3/04 |
| 代理公司: | 北京市柳沈律師事務(wù)所 11105 | 代理人: | 張曉明 |
| 地址: | 100080 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 特征信息 連續(xù)幀圖像 目標(biāo)檢測 幀圖像 目標(biāo)檢測裝置 分類器 計(jì)算機(jī)可讀存儲(chǔ)介質(zhì) 反饋神經(jīng)網(wǎng)絡(luò) 前饋神經(jīng)網(wǎng)絡(luò) 神經(jīng)網(wǎng)絡(luò) 像素點(diǎn) 檢測 | ||
本公開提供了一種基于神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測方法、目標(biāo)檢測裝置和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。所述目標(biāo)檢測方法包括:獲取包含目標(biāo)的待檢測的連續(xù)幀圖像;利用第一前饋神經(jīng)網(wǎng)絡(luò),獲取所述連續(xù)幀圖像中的每一幀圖像的第一特征信息;利用第二雙向反饋神經(jīng)網(wǎng)絡(luò),基于所述每一幀圖像的第一特征信息,獲取所述每一幀圖像的第二特征信息;以及利用至少一個(gè)分類器,基于所述第二特征信息,獲取所述連續(xù)幀圖像的每個(gè)像素點(diǎn)的對(duì)應(yīng)于所述至少一個(gè)分類器的屬性。
技術(shù)領(lǐng)域
本公開涉及人工智能(AI)中的圖像處理領(lǐng)域,更具體地,本公開涉及一種基于神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測方法、目標(biāo)檢測裝置和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
背景技術(shù)
目標(biāo)檢測是計(jì)算機(jī)視覺領(lǐng)域中一個(gè)基礎(chǔ)性的研究課題,其在人臉識(shí)別、安全監(jiān)控以及動(dòng)態(tài)追蹤等很多方面都有廣泛的應(yīng)用前景。在目標(biāo)檢測中,對(duì)包括作為目標(biāo)的行人、車輛的視頻結(jié)構(gòu)化是諸多安防應(yīng)用中不可或缺的。神經(jīng)網(wǎng)絡(luò)是一種大規(guī)模、多參數(shù)優(yōu)化的工具。依靠大量的訓(xùn)練數(shù)據(jù),神經(jīng)網(wǎng)絡(luò)能夠?qū)W習(xí)出數(shù)據(jù)中難以總結(jié)的隱藏特征,從而完成多項(xiàng)復(fù)雜的任務(wù),如人臉檢測,圖片分類,物體檢測,動(dòng)作追蹤,自然語言翻譯等。神經(jīng)網(wǎng)絡(luò)已被人工智能界廣泛應(yīng)用。當(dāng)前,諸如行人檢測的目標(biāo)檢測中最廣泛應(yīng)用的是卷積神經(jīng)網(wǎng)絡(luò)。
在現(xiàn)有的目標(biāo)檢測方法中,往往把目標(biāo)(行人和車輛)檢測、目標(biāo)追蹤以及視頻結(jié)構(gòu)化分成三個(gè)獨(dú)立的步驟來完成。在目標(biāo)檢測步驟中,對(duì)每一幀圖像,找到作為目標(biāo)的行人或車輛,通過邊框把它們的位置和大小表示出來。然后,把各幀中檢測到的目標(biāo),根據(jù)空間位置、外觀相似程度等因素關(guān)聯(lián)在一起,從而進(jìn)行目標(biāo)追蹤步驟。最后,分析一條追蹤軌跡中各個(gè)邊框中行人或車輛的屬性信息,實(shí)現(xiàn)結(jié)構(gòu)化的目的。在以上三個(gè)步驟中,都可能分別引入額外的誤差,從而造成誤差的傳播擴(kuò)大。尤其是在檢測步驟中,在擁擠環(huán)境下,邊框并不能很好地表示目標(biāo)的位置。例如,在擁擠的人群中,大量的行人相互遮擋,因此邊框也相互遮擋。如果使用邊框來分析行人的屬性,很容易因?yàn)楸黄渌藫踝。鴣G失信息,或引入錯(cuò)誤信息。
發(fā)明內(nèi)容
鑒于上述問題,本發(fā)明提供一種基于神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測方法、目標(biāo)檢測裝置以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
根據(jù)本公開的一個(gè)實(shí)施例,提供了一種目標(biāo)檢測方法,包括:獲取包含目標(biāo)的待檢測的連續(xù)幀圖像;利用第一前饋神經(jīng)網(wǎng)絡(luò),獲取所述連續(xù)幀圖像中的每一幀圖像的第一特征信息;利用第二雙向反饋神經(jīng)網(wǎng)絡(luò),基于所述每一幀圖像的第一特征信息,獲取所述每一幀圖像的第二特征信息;以及利用至少一個(gè)分類器,基于所述第二特征信息,獲取所述連續(xù)幀圖像的每個(gè)像素點(diǎn)的對(duì)應(yīng)于所述至少一個(gè)分類器的屬性。
此外,根據(jù)本公開的一個(gè)實(shí)施例的目標(biāo)檢測方法,其中,所述至少一個(gè)分類器包括第一目標(biāo)檢測分類器、第二部位劃分分類器以及第三屬性分類器。
此外,根據(jù)本公開的一個(gè)實(shí)施例的目標(biāo)檢測方法,其中,利用至少一個(gè)分類器,基于所述第二特征信息,獲取所述連續(xù)幀圖像的每個(gè)像素點(diǎn)的對(duì)應(yīng)于所述至少一個(gè)分類器的屬性包括:基于所述第二特征信息,利用所述第一目標(biāo)檢測分類器,確定每個(gè)像素點(diǎn)所屬目標(biāo)類別的類別屬性,并且聚類具有相同類別屬性的像素點(diǎn),以確定所述連續(xù)幀圖像中的目標(biāo);基于所述第二特征信息,利用所述第二部位劃分分類器,確定所述連續(xù)幀圖像中的目標(biāo)的各個(gè)部分;以及基于所述第二特征信息,利用所述第三屬性分類器,確定所述連續(xù)幀圖像中的目標(biāo)的各個(gè)部分的屬性。
此外,根據(jù)本公開的一個(gè)實(shí)施例的目標(biāo)檢測方法,其中,聚類具有相同類別屬性的像素點(diǎn),以確定所述連續(xù)幀圖像中的目標(biāo)包括:確定相同類別屬性的像素點(diǎn)中的一個(gè)像素點(diǎn)到其所屬中心點(diǎn)的位移,通過對(duì)于所述中心點(diǎn)的聚類,確定屬于同一目標(biāo)的像素點(diǎn)。
此外,根據(jù)本公開的一個(gè)實(shí)施例的目標(biāo)檢測方法,還包括:確定相同類別屬性的像素點(diǎn)中的一個(gè)像素點(diǎn)到所述目標(biāo)在預(yù)定數(shù)目的之前幀和之后幀中的所述中心點(diǎn)的位移,從而對(duì)所述目標(biāo)進(jìn)行追蹤。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京曠視科技有限公司;北京邁格威科技有限公司,未經(jīng)北京曠視科技有限公司;北京邁格威科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201710348872.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種視頻文件的生成方法及裝置
- 一種幀缺失圖像的處理方法及系統(tǒng)
- 視頻圖像顯示的方法、裝置及移動(dòng)終端
- 一種連續(xù)圖像的處理方法及裝置
- 拍攝方法及裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種圖像處理方法、裝置和用于圖像處理的裝置
- 一種構(gòu)建點(diǎn)云地圖的方法和設(shè)備
- 溺水監(jiān)測方法、設(shè)備、裝置及存儲(chǔ)介質(zhì)
- 對(duì)焦方法、對(duì)焦裝置及終端設(shè)備
- 車輛車門狀態(tài)的識(shí)別方法、裝置、設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)





