[發(fā)明專利]用于構(gòu)建用戶模型的改進(jìn)的GuTao法無(wú)效
| 申請(qǐng)?zhí)枺?/td> | 201110361047.7 | 申請(qǐng)日: | 2011-11-15 |
| 公開(公告)號(hào): | CN102495844A | 公開(公告)日: | 2012-06-13 |
| 發(fā)明(設(shè)計(jì))人: | 許國(guó)艷;于天樞 | 申請(qǐng)(專利權(quán))人: | 河海大學(xué) |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 南京經(jīng)緯專利商標(biāo)代理有限公司 32200 | 代理人: | 艾中蘭 |
| 地址: | 210098 *** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 構(gòu)建 用戶 模型 改進(jìn) gutao | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種改進(jìn)的GuTao法,用于構(gòu)建用戶模型,屬于個(gè)性化信息服務(wù)領(lǐng)域。
背景技術(shù)
個(gè)性化信息服務(wù)包括用戶建模、項(xiàng)目匹配和個(gè)性化推薦輸出三個(gè)部分。構(gòu)建用戶模型是個(gè)性化信息服務(wù)的基礎(chǔ)。在個(gè)性化信息服務(wù)研究早期,用戶建模技術(shù)并未得到重視。研究工作重點(diǎn)在于個(gè)性化信息服務(wù)的具體技術(shù)上,如用戶聚類技術(shù)、推薦技術(shù)、信息檢索技術(shù)等,用戶建模技術(shù)只是這些研究中的附屬。隨著研究的深入,研究者逐漸意識(shí)到:個(gè)性化信息服務(wù)的質(zhì)量不僅取決于具體的實(shí)現(xiàn)技術(shù),還取決于用戶興趣和偏好的可計(jì)算描述,即構(gòu)建用戶模型的質(zhì)量。
傳統(tǒng)的用戶模型構(gòu)建方法主要是基于統(tǒng)計(jì)學(xué)的,采用主題詞或加權(quán)的關(guān)鍵詞向量等表示用戶模型。通過對(duì)用戶瀏覽記錄、訪問歷史進(jìn)行概率分析,獲得用戶的興趣模型。這種方法理論成熟,使用相對(duì)簡(jiǎn)單,但存在缺乏語(yǔ)義、興趣度粒度大的缺點(diǎn)。
隨著語(yǔ)義技術(shù)地發(fā)展,本體作為概念化的模型,具有強(qiáng)大的語(yǔ)義擴(kuò)展和推理能力。利用本體語(yǔ)義上的優(yōu)勢(shì),將用戶建模技術(shù)和本體結(jié)合起來構(gòu)建基于本體的用戶模型是用戶建模技術(shù)的主要發(fā)展趨勢(shì)。
發(fā)明內(nèi)容
本發(fā)明基于本體構(gòu)建用戶模型,在具體的構(gòu)建方法上提出了改進(jìn)的GuTao法。GuTao法能夠半自動(dòng)的構(gòu)建領(lǐng)域本體,自動(dòng)生成形式背景并消除概念間的冗余,但存在著不能處理多值屬性的缺陷。本發(fā)明提出了以興趣度為權(quán)值,作為多種屬性向單值屬性轉(zhuǎn)換的依據(jù),解決了GuTao法不能處理多值屬性的問題,實(shí)現(xiàn)了對(duì)GuTao法的改進(jìn)。
本發(fā)明提出了將興趣度作為多值屬性向單值屬性的轉(zhuǎn)換依據(jù),在基本興趣度公式的基礎(chǔ)上推導(dǎo)出復(fù)合的興趣度公式。下面將介紹興趣度的基本公式以及根據(jù)需要的推導(dǎo)的公式。
1.興趣度的概念
興趣度(Interestingness)是用來衡量用戶對(duì)本體中的某概念的感興趣程度的一個(gè)度量指標(biāo)。它主要是面向用戶模型的使用者的,用戶的興趣描述越具體,越有實(shí)際價(jià)值。
2.基本的興趣度公式
興趣度計(jì)算公式主要有以下三種:
(1)I(Ci):表示對(duì)于概念Ci感興趣程度,形如公式1。
其中,time表示一個(gè)用戶用于瀏覽一個(gè)給定網(wǎng)頁(yè)的時(shí)間。length指網(wǎng)頁(yè)的長(zhǎng)度(如字節(jié)數(shù)等)。以r(d,Ci)表示網(wǎng)頁(yè)與概念的匹配強(qiáng)度,該值是一個(gè)頁(yè)面特征化過程的一個(gè)結(jié)果。
(2)Frequency(Ci):通過用戶檢索過程中與概念Ci相關(guān)的檢索數(shù)Q(Ci)與檢索總次數(shù)Q的比值來反映用戶對(duì)概念的感興趣程度。
其中Frequency(Ci)反映用戶對(duì)本體中某個(gè)概念Ci的感興趣程度。Q(Ci)是用戶對(duì)概念Ci檢索的次數(shù),Q表示用戶檢索的總次數(shù)。
(3)Clarity(Ci):通過清晰度反映了用戶提出的檢索反映其自身興趣的準(zhǔn)確性,通常當(dāng)用戶對(duì)于自己要查詢的事物越是不了解,他就越傾向于使用較為抽象的概念。具體公式為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于河海大學(xué),未經(jīng)河海大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201110361047.7/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 構(gòu)建墊、實(shí)體圖像構(gòu)建物和構(gòu)建構(gòu)建物支撐件的方法
- 支持松耦合的軟件構(gòu)建方法、系統(tǒng)及該系統(tǒng)的實(shí)現(xiàn)方法
- 版本的構(gòu)建系統(tǒng)及方法
- 工程構(gòu)建系統(tǒng)及其構(gòu)建方法
- 實(shí)例構(gòu)建方法、裝置及軟件系統(tǒng)
- 軟件構(gòu)建方法、軟件構(gòu)建裝置和軟件構(gòu)建系統(tǒng)
- 天花板地圖構(gòu)建方法、構(gòu)建裝置以及構(gòu)建程序
- 一種項(xiàng)目構(gòu)建方法、持續(xù)集成系統(tǒng)及終端設(shè)備
- 并行構(gòu)建的方法、裝置及設(shè)備
- 構(gòu)建肺癌預(yù)測(cè)模型構(gòu)建方法





