[發明專利]屬性冗余去除有效
| 申請號: | 201480055217.0 | 申請日: | 2014-09-16 |
| 公開(公告)號: | CN105612516B | 公開(公告)日: | 2020-02-07 |
| 發明(設計)人: | Z·M·王;吳思明 | 申請(專利權)人: | 甲骨文國際公司 |
| 主分類號: | G06F16/901 | 分類號: | G06F16/901 |
| 代理公司: | 11038 中國國際貿易促進委員會專利商標事務所 | 代理人: | 吳信剛 |
| 地址: | 美國加*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 屬性 冗余 去除 | ||
描述了與屬性冗余去除關聯的系統、方法和其它實施例。在一個實施例中,一種方法包括識別描述兩個物品的一組屬性中的冗余屬性值。該示例性方法還包括產生去除了冗余屬性值的一組修剪的屬性。至少部分地基于所述一組修剪的屬性值計算兩個物品的相似性。
背景技術
計算機使用屬性(例如,尺寸、顏色、味道、商標、包裝)描述特性和對物品進行分類。對應屬性值被提供作為屬性的描述性文本。例如,屬性“尺寸”具有對應屬性值,諸如小、中或大。屬性被用在零售分析應用中。在一個例子中,屬性被用于計算相似性得分,相似性得分是用于基于兩個物品的屬性評估這兩個物品多么相似的可量化方案。與不同的物品相比,相似的物品通常具有更接近的銷售分布(例如,銷售率)??赡茈y以識別彼此太相似的物品。存在用于識別太相似的物品的多種方案。一種方案基于針對屬性的值對它們進行匹配,從而使得兩個物品之間的相同屬性值的數量越高,這兩個物品的相似性越大。
發明內容
在一個實施例中公開了一種在至少包括處理器的數據處理系統中執行的方法,所述方法包括:訪問具有用于兩個物品的屬性值的屬性,其中所述屬性被以分層方式布置在樹中;識別冗余屬性值;修剪樹以去除冗余屬性值;以及至少部分地基于修剪的樹為這兩個物品計算相似性得分。
在本公開的另一方面,識別冗余屬性值包括識別不具有兄弟屬性值的子屬性值。在本公開的另一方面,識別冗余屬性值包括識別具有至少兩個子屬性值的父屬性值,其中一個子屬性值具有比其余子屬性值少的實例。在本公開的另一方面,識別冗余屬性包括識別具有比冗余閾值小的增加的辨別能力的屬性值。
在本公開的另一方面,該方法通過下述步驟來計算相似性得分:為這兩個物品確定匹配系數;將匹配系數與相似性閾值進行比較;以及當相似性得分超過相似性閾值時,將該物品確定為相似。在本公開的另一方面,匹配系數至少部分地基于匹配因子,匹配因子確定這兩個物品是否具有相同的屬性。在本公開的另一方面,匹配因子乘以加權系數。
在本公開的另一方面,針對多個物品迭代地執行為這兩個物品計算相似性得分。
在本公開的另一方面,該方法還包括:至少部分地基于相似性得分從存貨去除一個物品。
在本公開的另一方面,公開了一種至少包括處理器的數據處理系統,該數據處理系統包括:樹邏輯,被配置為接收具有用于至少兩個物品的屬性值的分類的屬性并且產生以分層方式布置屬性的樹;修剪邏輯,被配置為識別樹中的冗余屬性值并且從樹刪除冗余屬性值;和得分邏輯,被配置為至少部分地基于修剪的樹為所述至少兩個物品計算相似性得分。
在另一方面,修剪邏輯被配置為通過下述處理來修剪掉冗余屬性值:i)識別具有單個子屬性值的父屬性值;和ii)修剪掉該單個子屬性值。
在另一方面,修剪邏輯被配置為通過下述處理來修剪掉冗余屬性值:i)識別具有至少兩個子屬性值的父屬性值,并且其中一個子屬性值具有比所述至少兩個子屬性值中的其余子屬性值少的實例;和ii)修剪掉具有較少的值的子屬性值。
在另一方面,修剪邏輯被配置為通過識別不區分所述至少兩個物品的子屬性值來修剪掉冗余屬性值。
在另一方面,該數據處理系統還包括:存貨邏輯,被配置為至少部分地基于相似性得分從存貨去除所述至少兩個物品中的一個物品。
在另一方面,該系統的修剪邏輯被配置為識別冗余屬性值包括:識別一組分類的屬性中的個體屬性值和其余屬性值之間的關系;以及識別具有比關系閾值少的關系的個體屬性值。
在本公開的另一方面,公開了一種執行方法的計算機實現的系統,或者公開了一種存儲計算機可執行指令的非暫態計算機可讀介質,當所述計算機可執行指令由計算機執行時,所述計算機可執行指令使該計算機執行該方法。該方法包括:識別描述兩個物品的一組分類的屬性中的冗余屬性值,其中冗余屬性值是具有不足的辨別能力的屬性值;產生去除了冗余屬性值的一組修剪的分類的屬性;以及至少部分地基于所述一組修剪的分類的屬性計算這兩個物品的相似性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于甲骨文國際公司,未經甲骨文國際公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201480055217.0/2.html,轉載請聲明來源鉆瓜專利網。





