[發明專利]一種基于屬性相似度的本體匹配方法有效
| 申請號: | 201611214565.5 | 申請日: | 2016-12-26 |
| 公開(公告)號: | CN106777218B | 公開(公告)日: | 2020-04-28 |
| 發明(設計)人: | 張慧;袁震;丁鯤;嚴浩;曹建軍;俞赟;王芳瀟;彭琮;丁晨路 | 申請(專利權)人: | 中央軍委裝備發展部第六十三研究所 |
| 主分類號: | G06F16/9032 | 分類號: | G06F16/9032;G06F16/332 |
| 代理公司: | 南京理工大學專利中心 32203 | 代理人: | 陳鵬;朱顯國 |
| 地址: | 210007 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 屬性 相似 本體 匹配 方法 | ||
1.一種基于屬性相似度的本體匹配方法,其特征在于,該方法包括如下步驟:
步驟1,計算本體資源之間的字符串相似度,進行匹配粒度的錨匹配;
步驟2,對錨匹配的結果進行確認并刪除不正確的錨匹配項;
步驟3,根據步驟2的錨匹配結果,對本體中的所有資源進行全匹配,包括計算本體資源的結構相似度、字符串相似度以及屬性內容相似度;全匹配的具體過程為:
步驟3-1,設一個待匹配節點集合M為空,一個查詢節點集合S為空;
步驟3-2,將錨節點都放入S,錨匹配包含有兩個節點,分別來自兩個本體;
步驟3-3,搜索S集合的所有鄰近節點,逐一檢查其是否包含在S集合中,將不包含的鄰近節點加入集合S’,搜索完后,將S’中的所有節點同時加入到集合S和集合M;
步驟3-4,如果S’不為空,則進入步驟3-5;如果S’為空,S中的資源數少于兩個本體的總資源數,則將沒有包含在S中的資源同時放入集合S和集合M,進入步驟3-5;
步驟3-5,分別計算集合M中本體O1到本體O2類間的相似度和屬性間的相似度,具體為:
(1)計算類的相似度
假設有兩個類節點A,B,他們的相似度計算公式如下:
SC(A,B)=0.5*Sstr(A,B)+0.2*Ssuperclass(A,B)+0.2*Ssubclass(A,B)+0.1*Sproperty(A,B) (4)
其中,Sstr(A,B)是兩個數據庫資源A、B的字符串相似度,Ssuperclass(A,B)為A,B的父類的相似度,Ssubclass(A,B)為A,B的子類的相似度,Sproperty(A,B)為A,B的相關屬性的相似度;
式中,ca,cb分別為A和B的父節點,A.surperclass和B.surperclass分別為A和B的所有父節點的集合;
式中,ca′,cb′分別為A和B的子節點,A.subclass和B.subclass分別為A和B的所有子節點的集合;
A的所有相關屬性集合為PA,B的所有相關屬性集合為PB,不妨設pa屬于PA,pb屬于PB,Sp(pa,pb)表示屬性pa和pb的相似度;
則A,B的相關屬性的相似度為所有相關屬性相似度中的最大相似度:
(2)計算屬性的相似度
pa和pb的相似度為
Sp(pa,pb)=0.5*Sdomain(pa,pb)*Srange(pa,pb)+0.3*Sstr(pa,pb)+0.1*Ssubproperty(pa,pb)+0.1*Ssuperproperty(pa,pb) (8)
式中,Sdomain(pa,pb)為屬性pa和pb的domain相似度,Srange(pa,pb)為屬性pa和pb的range相似度,Sstr(pa,pb)為屬性pa和pb的字符串相似度,Ssubproperty(pa,pb)為子屬性的相似度,Ssuperproperty(pa,pb)為父屬性的相似度;
Sdomain(pa,pb)=Sc(domain(pa),domain(pb)) (9)
Sc(domain(pa),domain(pb))為兩個屬性定義域包含的類的相似度;
Srange(pa,pb)=Sc(range(pa),range(pb)) (10)
Sc(range(pa),range(pb))為兩個屬性值域包含的類的相似度;
a.subproperty和b.subproperty分別表示屬性a和屬性b所有的子屬性的集合,為pa和pb子屬性的最大相似度;
a.sup erproperty和b.sup erproperty分別表示屬性a和屬性b所有的父屬性的集合,為pa和pb父屬性的最大相似度;
步驟4,將步驟3得到的全匹配結果輸出到界面,檢查是否正確,并將不正確的匹配刪除;
步驟5,對步驟4中全匹配的結果進行沖突檢測,將沖突檢測的結果返回并進行確認,修正其中的沖突。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中央軍委裝備發展部第六十三研究所,未經中央軍委裝備發展部第六十三研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201611214565.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種搜索詞推薦方法及裝置
- 下一篇:用于虛擬化數據中心的數據處理方法及裝置





