[發明專利]基于稠密特征金字塔網絡的物體檢測方法有效
| 申請號: | 201811197745.6 | 申請日: | 2018-10-15 |
| 公開(公告)號: | CN109543672B | 公開(公告)日: | 2023-08-11 |
| 發明(設計)人: | 龐彥偉;曹家樂 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06V10/25 | 分類號: | G06V10/25;G06V10/46;G06V10/75;G06V10/82;G06N3/0464;G06N3/08;G06T7/50 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 程毓英 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 稠密 特征 金字塔 網絡 物體 檢測 方法 | ||
本發明涉及一種基于稠密特征金字塔網絡的物體檢測方法,包括下列步驟:確定基礎網絡架構,用于從輸入圖像中提取不同語義級別的深度特征,不同卷積塊輸出的特征圖分辨率從下到上由逐漸降低。設計稠密連接網絡部分,利用自上而下的跨層連接稠密地生成具有高級語義的特征圖,將基礎網絡中最后輸出的低分率特征圖逐漸雙線性差值上采樣,使其與基礎網絡中所有卷積塊中所有卷積層一一對用,并將其與基礎網絡中對應的特征圖進行相加,最終得到若干高級語義且分辨率不同的特征圖。設計細尺度預測部分,利用具有不同感受野的特征圖分別提取不同尺度的候選檢測窗口。輸出物體檢測結果。
技術領域
本發明涉及計算機視覺領域中魯棒有效的物體檢測方法,特別是涉及基于深度卷積神經網絡進行物體檢測的方法。
背景技術
物體檢測是指識別圖像或視頻序列中存在物體(如行人、車輛等)的類別,并定位物體的位置。物體檢測可以廣泛應用于許多計算機視覺任務中,如自動駕駛、輔助駕駛、人機交互、身份認證、智能視頻監控等。圖1給出了物體檢測在自動駕駛和身份認證等兩個領域的應用示例。在圖1(a)中,為了更好地進行駕駛決策、避免交通事故的發生,汽車的自動駕駛系統需要能夠及時準確地檢測汽車前方的行人、騎車人等。在圖1(b)中,為了能夠識別圖像中具體人的身份信息,身份識別系統需要先檢測出圖像中存在的人臉。
近年來,隨著深度學習技術的發展,基于深度學習的方法開始在計算機視覺任務(如圖像分類、物體檢測、超分辨率重建、圖像分割)中取得巨大的成功。具體到物體檢測領域,基于深度卷積神經網絡的方法取得了巨大的成功。在基于卷積神經網絡的物體檢測方法中,最具有代表性的物體檢測方法為Faster?RCNN[1]。Faster?RCNN進行物體檢測的主要過程分為兩步:候選檢測窗口的生成和候選檢測窗口的分類。候選窗口的生成旨在提取圖像中可能存在物體的所有候選檢測窗口,而候選檢測窗口的分類旨在分類這些候選窗口(即識別候選窗口的具體物體類別)。為了減少網絡的計算消耗量、加快物體檢測的速度,Faster?RCNN的上述兩個過程(即候選窗口的生成和候選窗口的分類)共享同一個基礎網絡。換而言之,基于基礎網絡的輸出特征圖,Faster?RCNN進行候選窗口的生成和候選窗口的分類。一般而言,基礎網絡可以采用圖像分類中常用的模型(如VGG[2]、ResNet[3]),包括若干的卷積層、激活層(ReLU)以及池化層等。因而,基礎網絡輸出的特征圖具有相對較小的空間分辨率和相對較大的感受野。由于相對較小的空間分辨率,小尺度物體的空間信息將會大量丟失。同時,相對較大的感受野也不能夠很好地匹配所有尺度的物體,特別是小尺度物體。基于以上分析,Faster?RCNN不能夠很好地解決物體檢測中的尺度變化問題,仍然存在很大的提升空間。
為了能夠更好地應對物體尺度變化的問題,近些年研究人員提出了許多的多尺度物體檢測方法。這些多尺度方法主要分為兩類:基于圖像金字塔的方法[1][4]和基于特征金字塔的方法[5][6][7][8][9]。基于圖像金字塔的方法首先將輸入圖像縮放成一系列不同尺度的圖像,然后分別將每個尺度的圖像送入神經網絡中進行檢測,最后合并各個尺度下的物體檢測結果。該方法在一定程度上克服了物體尺度變化的影響,提升了物體檢測的性能。但是,由于該方法需要將不同尺度的圖像分別送入神經網絡中,因而該方法在檢測過程中十分耗時。基于特征金字塔的方法主要利用神經網絡中不同卷積層輸出的不同分辨率特征圖分別檢測不同尺度的物體。相比于基于圖像金字塔的方法,基于特征金字塔的方法在提升物體檢測性能的同時具有更高的檢測效率。因而,基于特征金字塔的方法受到更好研究人員的青睞,在物體檢測中具有更廣泛的應用。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201811197745.6/2.html,轉載請聲明來源鉆瓜專利網。





