[發明專利]一種基于時空圖卷積網絡的人臉檢測方法及裝置在審
| 申請號: | 202011417104.4 | 申請日: | 2020-12-07 |
| 公開(公告)號: | CN112381064A | 公開(公告)日: | 2021-02-19 |
| 發明(設計)人: | 于吉鵬;侯博嚴;李馳;劉巖 | 申請(專利權)人: | 泰康保險集團股份有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06N3/04;G06N3/08 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 賈磊;許曼 |
| 地址: | 100031 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 時空 圖卷 網絡 檢測 方法 裝置 | ||
1.一種基于時空圖卷積網絡的人臉檢測方法,其特征在于包括,
獲取視頻中每一幀圖像中人臉的特征點;
將多幀圖像的人臉特征點相關數據輸入時空圖卷積網絡中進行處理;其中,通過所述時空圖卷積網絡中的空間圖卷積得到所述特征點之間的位置關系,通過所述時空圖卷積網絡中的時間圖卷積得到同一特征點在時間上的位置變化關系,所述人臉特征點相關數據包括特征點位置信息、幀數信息、特征點數量信息;
輸出人臉檢測結果。
2.根據權利要求1所述的方法,其特征在于,在獲取視頻中每一幀圖像中人臉的特征點中進一步包括,
將所述視頻中每一幀圖像中人臉劃分區域,得到眼部、嘴部、臉部外輪廓三個區域;
其中,在所述眼部區域獲取M個特征點,在所述嘴部區域獲取N個特征點,在臉部外輪廓區域獲取S個特征點,所述M、N、S為自然數。
3.根據權利要求2所述的方法,其特征在于,人臉特征點相關數據具體包括,M+N+S個特征點,每個特征點包括T個數據,所述T為多幀圖像的幀數,所述每個特征點T個數據中的每個數據包括在每一幀中該特征點二維坐標信息。
4.根據權利要求3所述的方法,其特征在于,通過所述時空圖卷積網絡中的空間圖卷積得到所述特征點之間的位置關系進一步包括,
對所述輸入的人臉特征點相關數據進行空間圖卷積處理,所使用的空間圖卷積公式如下:
其中,Dout為空間圖卷積處理的輸出矩陣,矩陣格式為(Cnew,T,V),Cnew代表經過空間圖卷積處理后的特征點位置信息的特征向量維度,T表示幀數,V表示特征點數量;Din為輸入的人臉特征點相關數據形成的矩陣,矩陣格式為(Cold,T,V)的輸入網絡,所述Cold代表輸入的特征點位置信息的特征向量維度;j代表按照特征點之間邊長度進行劃分,將不同劃分的卷積結果加權平均;Wj代表卷積核,矩陣格式為(j,Cnew,T,V);Aj表示同一幀圖像的內連接關系矩陣,矩陣格式為(I,V,V),I代表劃分方式,兩個V代表特征點數量。
5.根據權利要求4所述的方法,其特征在于,根據不同劃分方式中特征點的鄰接矩陣和相應的度矩陣構成相應劃分方式的Aj矩陣。
6.根據權利要求5所述的方法,其特征在于,在通過所述時空圖卷積網絡中的時間圖卷積得到同一特征點在時間上的位置變化關系中進一步包括,
對經過所述空間圖卷積處理的人臉特征點相關數據進行時間圖卷積處理,所使用的時間圖卷積公式如下:
Dout′=ADin′W
其中,Dout′為時間圖卷積處理的輸出矩陣,矩陣格式為(C,Tnew,V),C代表特征點位置信息的特征向量維度,Tnew代表時間圖卷積處理后的幀數,V表示特征點數量;Din′為輸入的人臉特征點相關數據形成的矩陣,矩陣的格式為(C,Told,V)的輸入網絡,所述Told代表輸入的幀數;W代表卷積核,矩陣格式為(C,P,Q),其中,P代表連接多幀圖像中連接同一特征點構成時間圖的幀數,Q代表時間卷積滑動步長;A代表幀與幀之間的關聯關系,矩陣格式為(Told,Told)。
7.根據權利要求5所述的方法,其特征在于,將多幀圖像的人臉特征點相關數據輸入時空圖卷積網絡中進行處理中進一步包括,
對所述人臉特征點相關數據多次順序執行時空圖卷積網絡處理;
其中,將順序上靠后執行的時空圖卷積網絡處理中的所述空間圖卷積中卷積核的特征點位置信息的特征向量維度變化特定倍數;將所述時間圖卷積中卷積核的時間卷積滑動步長進行改變。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于泰康保險集團股份有限公司,未經泰康保險集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202011417104.4/1.html,轉載請聲明來源鉆瓜專利網。





