[發(fā)明專利]一種基于本體詞法信息和語(yǔ)義信息的本體匹配方法無(wú)效
| 申請(qǐng)?zhí)枺?/td> | 201110330953.0 | 申請(qǐng)日: | 2011-10-27 |
| 公開(kāi)(公告)號(hào): | CN102360394A | 公開(kāi)(公告)日: | 2012-02-22 |
| 發(fā)明(設(shè)計(jì))人: | 廖建新;戚琦;王純;李煒;劉秀磊;張磊;沈奇威;樊利民 | 申請(qǐng)(專利權(quán))人: | 北京郵電大學(xué) |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30;G06F17/27 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 100876 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 本體 詞法 信息 語(yǔ)義 匹配 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種基于本體詞法信息和語(yǔ)義信息的本體匹配方法,屬于計(jì)算機(jī)技術(shù)領(lǐng)域, 特別是屬于本體技術(shù)領(lǐng)域。
背景技術(shù)
本體(ontology)是共享概念模型的明確的形式化規(guī)范說(shuō)明,使得計(jì)算機(jī)對(duì)知識(shí)能夠共享、 重用、互操作,并在語(yǔ)義Web,知識(shí)數(shù)據(jù)工程,電子商務(wù)等領(lǐng)域中廣泛應(yīng)用。由于不同背景 的知識(shí)工程師構(gòu)造和維護(hù)相似或相同域的本體,導(dǎo)致了本體之間的異構(gòu),這阻礙了知識(shí)的共 享、重用、互操作,本體匹配(ontology?matching)是解決該問(wèn)題主要方法之一。
本體匹配是指發(fā)現(xiàn)相似或相同域中不同本體中相同類型實(shí)體(entity)之間的匹配關(guān)系, 實(shí)體包括概念(concepts)、屬性(properties)、個(gè)體(individuals)。目前,本體匹配系統(tǒng)多是 利用實(shí)體標(biāo)簽和評(píng)論中單詞的單個(gè)詞義和本體中實(shí)體間的結(jié)構(gòu),計(jì)算實(shí)體間的相似性,從而 得出匹配關(guān)系。由于這些本體匹配系統(tǒng)沒(méi)有有效利用本體的詞法信息和語(yǔ)義信息,較少關(guān)注 實(shí)體中的單詞詞義的擴(kuò)展,單詞詞義的組合方式,特殊含義單詞的處理,本體中的語(yǔ)義信息 等對(duì)匹配結(jié)果的影響,導(dǎo)致這些本體匹配系統(tǒng)的實(shí)際匹配結(jié)果并不好。因此如何有效利用本 體的詞法信息和語(yǔ)義信息,提高本體匹配的質(zhì)量,成為本體應(yīng)用過(guò)程中一個(gè)急需要解決的技 術(shù)難題。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的目的是發(fā)明一種本體匹配方法,能有效利用本體的詞法信息和語(yǔ)義 信息。
為了達(dá)到上述目的,本發(fā)明提出了一種基于本體詞法信息和語(yǔ)義信息的本體匹配方法,
所述方法包括下列操作步驟:
(1)將待匹配的兩個(gè)本體分別定為源本體和目標(biāo)本體,計(jì)算來(lái)自源本體與目標(biāo)本體的 概念匹配候選集合,計(jì)算來(lái)自源本體與目標(biāo)本體的屬性匹配候選集合,然后合并 所述的屬性匹配候選集合和概念匹配候選集合,得到第一匹配候選集合MCO;
(2)對(duì)步驟1所獲得的第一匹配候選集合MCO中的匹配候選進(jìn)行循環(huán)過(guò)濾,得到第 二匹配候選集合MCF;
(3)對(duì)步驟2所獲得的第二匹配候選集合MCF,根據(jù)相似性原則進(jìn)行細(xì)化,產(chǎn)生第三 匹配候選集合MCFS;
(4)對(duì)步驟2所獲得的第二匹配候選集合MCF,根據(jù)包含原則進(jìn)行細(xì)化,產(chǎn)生第四匹 配候選集合MCFC;
(5)把步驟3所獲得的第三匹配候選集合MCFS和步驟4所獲得的第四匹配候選集合 MCFC進(jìn)行合并,得到最終的匹配集合。
所述步驟1中的計(jì)算來(lái)自源本體與目標(biāo)本體的概念匹配候選集合的具體內(nèi)容包括下列操 作步驟:
(101)得到源本體概念列表CLS,得到目標(biāo)本體概念列表CLT;
(102)取源本體概念列表CLS中的概念ConceptSource,取目標(biāo)本體概念列表CLT中 的概念ConceptTarget;
(103)按照設(shè)定的實(shí)體之間關(guān)系的計(jì)算方法,計(jì)算概念ConceptSource和概念 ConceptTarget之間的關(guān)系,如果存在關(guān)系Relation,則獲得如下匹配候選: MC(ConceptSource,ConceptTarget)=<ConceptSource,ConceptTarget,Relation> ,并添加到所述的概念匹配候選集合中;關(guān)系Relation分為包括include關(guān)系、被 包括beIncluded關(guān)系、相等equivalent關(guān)系、不相交disjoint關(guān)系四類;
(104)轉(zhuǎn)到步驟102直到遍歷計(jì)算完分別來(lái)自源本體概念列表CLS和目標(biāo)本體概念列 表CLT中的任意兩個(gè)概念。
所述步驟1中的計(jì)算來(lái)自源本體與目標(biāo)本體的屬性匹配候選集合的具體內(nèi)容包括下列操 作步驟:
(111)得到源本體屬性列表PLS,得到目標(biāo)本體屬性列表PLT;
(112)取源本體屬性列表PLS中的屬性PropertySource,取目標(biāo)本體屬性列表PLT中 的屬性PropertyTarget;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京郵電大學(xué),未經(jīng)北京郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201110330953.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種基于詞網(wǎng)語(yǔ)言模型的連續(xù)語(yǔ)音識(shí)別系統(tǒng)
- 基于人工智能分類語(yǔ)音輸入文本的方法和裝置
- 一種廣告素材數(shù)據(jù)生成方法、裝置及系統(tǒng)
- 網(wǎng)管系統(tǒng)北向監(jiān)控訂購(gòu)?fù)ㄖ^(guò)濾方法
- 詞法分析模型的訓(xùn)練方法、裝置、電子設(shè)備、存儲(chǔ)介質(zhì)
- 一種驗(yàn)證方法、裝置和存儲(chǔ)介質(zhì)
- 解碼方法、語(yǔ)音識(shí)別設(shè)備和系統(tǒng)
- 一種面向神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯的英文詞法分析方法及系統(tǒng)
- 用于確定輸出詞法單元的方法和設(shè)備
- 基于Bi-LSTM-CRF的三位一體字標(biāo)注漢語(yǔ)詞法分析方法
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





