[發明專利]用于處理樣本的方法和裝置有效
| 申請號: | 201710890902.0 | 申請日: | 2013-03-15 |
| 公開(公告)號: | CN107657280B | 公開(公告)日: | 2021-08-03 |
| 發明(設計)人: | C·埃文斯 | 申請(專利權)人: | 英特爾公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/00;G06N7/00;G06N3/08;G10L15/14 |
| 代理公司: | 永新專利商標代理有限公司 72002 | 代理人: | 劉瑜;王英 |
| 地址: | 美國加*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 處理 樣本 方法 裝置 | ||
系統和方法可以提供:將多個訓練樣本劃分為第一質心順序列表,移除所述第一質心順序列表中的一個或多個重復質心以獲取第一精簡的質心列表,以及基于所述第一精簡的質心列表來生成隱馬爾可夫模型(HMM)參數的集合。此外,可以將多個檢測樣本劃分為第二質心順序列表,其中,可以移除所述第二質心順序列表中的一個或多個重復質心以獲取第二精簡的質心列表。可以使用所述第二精簡的質心列表來確定所述多個檢測樣本與HMM參數的集合之間的匹配概率。在一個示例中,精簡的質心列表缺乏時間變化性。
本申請為分案申請,其原申請是于2015年08月14日向中國專利局提交的專利申請,申請號為201380073060.X,發明名稱為“實時的連續交互學習及檢測”。
技術領域
實施例整體上涉及對交互(例如,姿勢和語言輸入)進行的基于計算機的檢測。更具體地,實施例涉及實時人機交互的連續學習和檢測。
背景技術
人體運動具有很多細微之處,這些細微之處使得難以對運動進行建模,雖然在合理的時間框架中并非不可能。例如,由于在對給定姿勢進行建模中可能要考慮空間和時間因素二者,因此,對于需要檢測其姿勢的群體在該姿勢被多快地執行可能具有巨大的差異。將這些變動考慮在建模中可能引入不確定性,這種不確定性可能降低姿勢檢測決策的準確性。此外,傳統的檢測算法可能針對感興趣的姿勢的潛在起點和終點執行耗時的搜索。這可能使性能減慢并且使緊接的(back-to-back)姿勢的檢測(例如,連續檢測)變得不可行。簡言之,對實時系統而言,常規姿勢學習和檢測系統的處理時間可能是過長的。
附圖說明
通過閱讀以下說明和所附的權利要求,以及通過參照以下附圖,實施例的各種優點對本領域技術人員而言將變得顯而易見,在附圖中:
圖1是根據實施例的學習/訓練序列的示例的框圖;
圖2是根據實施例的檢測序列的示例的框圖;
圖3是根據實施例的處理訓練樣本的方法的示例的流程圖;
圖4是根據實施例的處理檢測樣本的方法的示例的流程圖;
圖5是根據實施例的計算設備的示例的框圖;
圖6是根據實施例的處理器的示例的框圖;以及
圖7是根據實施例的系統的示例的框圖。
具體實施方式
現轉向圖1,示出了針對多個訓練樣本16(16a-16c)的訓練序列10。在一個示例中,訓練樣本16表示在一個或多個訓練會話期間由例如圖像/深度傳感器等的傳感器14捕獲的姿勢樣本(例如,人體姿勢輸入)。在這樣的情況下,訓練樣本16可以在訓練會話期間從空間坐標12(例如,二維/2D、三維/3D、n維)中獲得,所述空間坐標12與一個或多個對象(例如,人類、動物、機器人、機器)的物理部件(例如,手、手指、虹膜等)的位置相對應。
例如,訓練樣本的第一集合16a可以與第一對象(例如,來自第一群體統計的個體)相對應,訓練樣本的第二集合16b可以與第二對象(例如,來自第二群體統計的個體)相對應,訓練樣本的第三集合16c可以與第三對象(例如,來自第三群體統計的個體)相對應等。當對象做出例如圓周形的手部運動等的特定的手部動作時,可以對該對象進行可視化地監測和/或記錄。
訓練樣本16還可以表示語音樣本(例如,人類語言輸入),其中,傳感器14可以包括在訓練會話期間設置于一個或多個對象的可聽范圍內的麥克風。在這樣的情況下,訓練樣本16可以包括從語言輸入提取的音素數據。其他類型的交互數據還可以用于訓練樣本16。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于英特爾公司,未經英特爾公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201710890902.0/2.html,轉載請聲明來源鉆瓜專利網。





