[發明專利]對象識別裝置、對象識別方法和程序在審
| 申請號: | 201310667202.7 | 申請日: | 2013-11-26 |
| 公開(公告)號: | CN104680123A | 公開(公告)日: | 2015-06-03 |
| 發明(設計)人: | 劉偉;范偉;何源;孫俊;皆川明洋;堀田悅伸 | 申請(專利權)人: | 富士通株式會社 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 王萍;李春暉 |
| 地址: | 日本神*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 對象 識別 裝置 方法 程序 | ||
技術領域
本申請涉及圖像處理領域,具體地涉及識別圖像中的對象。更具體地,本申請涉及一種對象識別裝置和方法以及程序。
背景技術
識別圖像中的對象對于人機交互、自動控制等應用有著重要的意義。例如,可以通過識別圖像或視頻輸入中的人的手勢來進行各種控制或觸發各種應用。在人機交互中,手勢是一種重要的媒介,可以解除人們對于傳統輸入輸出方式的束縛,提供擴展性的手段。
但是,在實際應用中,有些對象具有形態多變的特性,比如手勢在不同的圖像中可以具有任意的形狀。在這種情況下,同為對象的個體差異較大,在識別時往往需要將對象分為若干大的類別而不完全局限于細節。因此,期望提供一種準確的識別裝置和方法。
發明內容
在下文中給出了關于本發明的簡要概述,以便提供關于本發明的某些方面的基本理解。應當理解,這個概述并不是關于本發明的窮舉性概述。它并不是意圖確定本發明的關鍵或重要部分,也不是意圖限定本發明的范圍。其目的僅僅是以簡化的形式給出某些概念,以此作為稍后論述的更詳細描述的前序。
鑒于背景技術部分所述的需求,本發明關注于如何識別圖像中的形狀多變的對象。具體地,本發明提出了一種通過利用包括圖像特征的分布和圖像特征相對于隱主題的分布的語義主題模型進行分類的對象識別裝置和方法,由于其有效利用了圖像特征相對于隱主題的分布信息,因此可獲得更好的分類效果。
根據本發明的一個方面,提供了一種識別輸入圖像中的對象的對象識別裝置,包括:圖像特征提取單元,被配置為提取輸入圖像中的待識別對象的圖像特征;主題獲取單元,被配置為基于圖像特征采用生成主題模型獲得與待識別對象有關的主題;語義主題模型生成單元,被配置為基于圖像特征和主題生成與待識別對象有關的語義主題模型,其中,語義主題模型包括圖像特征的分布以及各個圖像特征相對于各個主題的分布;分類器,被配置為對語義主題模型進行分類,以便確定輸入圖像中是否存在待識別對象。
根據本發明的另一個方面,提供了一種識別輸入圖像中的對象的對象識別方法,包括:提取輸入圖像中的待識別對象的圖像特征;基于圖像特征采用生成主題模型獲得與待識別對象有關的主題;基于圖像特征和主題生成與待識別對象有關的語義主題模型,其中,語義主題模型包括圖像特征的分布以及各個圖像特征相對于各個主題的分布;采用預定的分類器對語義主題模型進行分類,以便確定輸入圖像中是否存在待識別對象。
依據本發明的其它方面,還提供了相應的計算機程序代碼、計算機可讀存儲介質和計算機程序產品。
通過以下結合附圖對本發明的優選實施例的詳細說明,本發明的這些以及其他優點將更加明顯。
附圖說明
為了進一步闡述本申請的以上和其它優點和特征,下面結合附圖對本申請的具體實施方式作進一步詳細的說明。所述附圖連同下面的詳細說明一起包含在本說明書中并且形成本說明書的一部分。具有相同的功能和結構的元件用相同的參考標號表示。應當理解,這些附圖僅描述本申請的典型示例,而不應看作是對本申請的范圍的限定。在附圖中:
圖1是示出了根據本申請的一個實施例的對象識別裝置的配置的圖;
圖2示出了潛在狄利克雷分配模型的示意圖;
圖3是示出了根據本申請的另一個實施例的對象識別裝置的配置的圖;
圖4是根據本申請的一個實施例的對象識別裝置獲得的語義主題模型的矩陣表示的一個示例;
圖5是示出了根據本申請的又一個實施例的對象識別裝置的配置的圖;
圖6是示出了根據本申請的一個實施例的分割單元的配置的圖;
圖7是示出了輸入圖像以及對該輸入圖像進行分割的示例的圖;
圖8是示出了從圖7的輸入圖像中分割獲得的手的候選區域的示例的圖;
圖9是示出了基于二維高斯分布對圖8的手的候選區域進行特征點采樣的示意圖;
圖10是示出了根據本申請的一個實施例的對象識別方法的流程圖;
圖11是示出了根據本申請的另一個實施例的對象識別方法的流程圖;
圖12是示出了根據本申請的又一個實施例的對象識別方法的流程圖;
圖13是示出了根據本申請的一個實施例的分割步驟的流程圖;以及
圖14是其中可以實現根據本發明的實施例的方法和/或裝置的通用個人計算機的示例性結構的框圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于富士通株式會社;,未經富士通株式會社;許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201310667202.7/2.html,轉載請聲明來源鉆瓜專利網。





