[發明專利]網絡內容自動推薦方法、裝置和系統有效
| 申請號: | 201310309049.0 | 申請日: | 2013-07-22 |
| 公開(公告)號: | CN103399891A | 公開(公告)日: | 2013-11-20 |
| 發明(設計)人: | 吳先超;陳龍 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 網絡 內容 自動 推薦 方法 裝置 系統 | ||
技術領域
本發明涉及互聯網技術領域,尤其涉及一種網絡內容自動推薦方法、裝置和系統。
背景技術
日常生活中,人們對互聯網的依賴程度越來越高。大家可以通過互聯網,獲取資訊,聯系朋友。于是,有的互聯網站點開始收集用戶的互聯網訪問數據,并通過對不同用戶的互聯網的歷史訪問數據的分析獲知用戶對哪些領域的資訊更為感興趣,在依據這樣的分析結果為用戶推薦他們可能會喜愛的網絡內容。
在這樣的為用戶推薦網絡內容的方法中,大多數方法都需要使用機器學習算法來對用戶進行分類,以確定用戶感興趣的領域。現有的網絡內容推薦方法大都收集用戶一段時間內的互聯網訪問數據,對這些數據進行人工標注以區分領域,利用標注好的數據通過機器學習的方法訓練用戶分類器,再利用訓練好的用戶分類器對用戶進行分類,最后根據用戶的分類向用戶推薦網絡內容。也就是說,現有的網絡內容推薦方法多采用完全監督、非增量的機器學習方法對用戶的互聯網訪問數據進行學習。現有的網絡內容推薦方法雖然實現了向用戶推薦網絡站點,但是根據這種方法向用戶推薦的網絡內容不具有時效性。因為用戶在不同的時間段的興趣點可能會不同,而根據現有的方法向用戶推薦的內容是不會發生改變的。而且,訓練用戶分類器需要人工對大量的互聯網訪問數據進行標注,成本較高。
發明內容
有鑒于此,本發明提出一種網絡內容自動推薦方法、裝置和系統,能夠使得向用戶推薦的網絡內容更具有時效性,同時大幅降低在分類器訓練階段人工數據標注的工作量。
第一方面,本發明實施例提供了一種網絡內容自動推薦方法,所述方法包括:
接收網絡文本數據,從接收的網絡文本數據中提取關鍵詞;
利用所述關鍵詞按照增量學習的方式訓練關鍵詞分類器;
接收特定用戶的網絡文本數據,根據所述關鍵詞分類器對從所述特定用戶的網絡文本數據中提取的關鍵詞的分類結果對所述特定用戶進行分類;以及
根據對所述特定用戶的分類,并按照預先定義的網絡內容的分類向特定用戶推薦特定用戶感興趣的網絡內容。
第二方面,本發明實施例提供了一種網絡內容自動推薦裝置,所述裝置包括:
關鍵詞提取模塊,用于接收網絡文本數據,從接收的網絡文本數據中提取關鍵詞;
關鍵詞分類器訓練模塊,用于利用所述關鍵詞按照增量學習的方式訓練關鍵詞分類器;
特定用戶分類模塊,用于接收特定用戶的網絡文本數據,根據所述關鍵詞分類器對從所述特定用戶的網絡文本數據中提取的關鍵詞的分類結果對所述特定用戶進行分類;以及
網絡內容推薦模塊,用于根據對所述特定用戶的分類,并按照預先定義的網絡內容的分類向特定用戶推薦特定用戶感興趣的網絡內容。
第三方面,本發明實施例提供了一種網絡內容自動推薦系統,包括服務器和客戶端,所述服務器包括如上第二方面所述的網絡內容自動推薦裝置。
本發明利用半監督學習方法進行增量學習,訓練關鍵詞分類器,然后利用訓練的關鍵詞分類器將用戶區分為多個類別,最后根據每個用戶的類別向用戶推薦網絡內容,不僅實現了根據互聯網用戶的個人興趣向用戶推薦網絡內容,而且能夠根據用戶個人興趣的變化實時改變站點推薦的類別,并且省去了分類器訓練過程中的大量人工數據標注。
附圖說明
圖1是本發明第一實施例提供的網絡內容自動推薦方法的流程示意圖。
圖2是本發明第一實施例提供的關鍵詞提取的流程示意圖。
圖3是本發明第一實施例提供的特定用戶分類的流程示意圖。
圖4是本發明第一實施例提供的網絡內容推薦的流程示意圖
圖5a是本發明第一實施例提供的向用戶推薦網絡站點的圖形用戶界面的示意圖。
圖5b是本發明第一實施例提供的經過增量學習后向用戶推薦網絡站點的圖形用戶界面的示意圖。
圖6是本發明第二實施例提供的網絡內容自動推薦裝置的結構示意圖。
圖7是本發明第三實施例提供的網絡內容自動推薦系統的結構示意圖。
具體實施方式
下面結合附圖并通過具體實施例來進一步說明本發明的技術方案。
圖1至圖5b示出了本發明的第一實施例。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201310309049.0/2.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





