[發明專利]用戶挖掘及其模型構建方法、裝置及計算機設備在審
| 申請號: | 201910010777.9 | 申請日: | 2019-01-07 |
| 公開(公告)號: | CN109783539A | 公開(公告)日: | 2019-05-21 |
| 發明(設計)人: | 袁小燕;張紀紅 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458 |
| 代理公司: | 深圳市隆天聯鼎知識產權代理有限公司 44232 | 代理人: | 劉抗美;胡明 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶群 初選 用戶挖掘 行為數據 場景 機器學習模型 計算機設備 模型構建 目標用戶 語義特征 負樣本 正樣本 行為融合 準確率 構建 篩選 挖掘 預測 | ||
本發明公開了一種用戶挖掘及其模型構建方法、裝置及計算機設備,所述方法包括:根據目標用戶的語義特征表達對待挖掘用戶群中的用戶進行篩選,得到所包含用戶符合語義特征表達的初選用戶群;獲取所述初選用戶群中用戶在不同場景的行為數據;基于所述初選用戶群中用戶在不同場景的行為數據,對所述初選用戶群中用戶進行多場景行為融合的綜合評分;根據所述初選用戶群中用戶的綜合分值,從所述初選用戶群中用戶在不同場景的行為數據中選取正樣本和負樣本;通過所述正樣本和所述負樣本引導機器學習模型進行訓練,由完成訓練的機器學習模型構建得到用于實現目標用戶預測的用戶挖掘模型。采用本發明解決了現有技術中用戶挖掘的準確率不高的問題。
技術領域
本發明涉及大數據技術領域,尤其涉及一種用戶挖掘及其模型構建方法、裝置及計算機設備。
背景技術
隨著大數據的發展,針對廣告投放領域來說,如何高效地獲取大量購買產品的潛在用戶,現已成為廣告投放商的迫切需求。
目前,人工智能技術已廣泛應用于廣告投放的用戶挖掘中,即,基于機器學習模型從廣大用戶中預測得到目標用戶,進而向目標用戶推廣產品。
然而,在目標用戶中,仍可能存在因興趣愛好等自身原因而對推廣產品完全不感興趣的用戶,那么,這一類用戶勢必不可能成為購買產品的潛在用戶,反而增加了廣告投放商的投放成本。
由上可知,現有的用戶挖掘仍存在準確性不高的問題。
發明內容
為了解決相關技術中存在的用戶挖掘的準確率不高的問題,本發明各實施例提供一種用戶挖掘及其模型構建方法、裝置及計算機設備。
其中,本發明所采用的技術方案為:
根據本發明公開的一方面,一種應用于用戶挖掘的模型構建方法,包括:根據目標用戶的語義特征表達對待挖掘用戶群中的用戶進行篩選,得到所包含用戶符合語義特征表達的初選用戶群;獲取所述初選用戶群中用戶在不同場景的行為數據;基于所述初選用戶群中用戶在不同場景的行為數據,對所述初選用戶群中用戶進行多場景行為融合的綜合評分;根據所述初選用戶群中用戶的綜合分值,從所述初選用戶群中用戶在不同場景的行為數據中選取正樣本和負樣本;通過所述正樣本和所述負樣本引導機器學習模型進行訓練,由完成訓練的機器學習模型構建得到用于實現目標用戶預測的用戶挖掘模型。
根據本發明公開的另一方面,一種用戶挖掘方法,包括:獲取待挖掘用戶群中用戶在不同場景的行為數據;調用用戶挖掘模型,對所述待挖掘用戶群中用戶在不同場景的行為數據進行目標用戶預測,得到目標用戶群;其中,所述用戶挖掘模型是通過正樣本和負樣本引導機器學習模型訓練得到的,所述正樣本和所述負樣本與所述待挖掘用戶群中用戶在多場景行為融合中的綜合分值有關。
根據本發明公開的另一方面,一種應用于用戶挖掘的模型構建裝置,包括:第一用戶篩選模塊,用于根據目標用戶的語義特征表達對待挖掘用戶群中的用戶進行篩選,得到所包含用戶符合語義特征表達的初選用戶群;行為數據獲取模塊,用于獲取所述初選用戶群中用戶在不同場景的行為數據;用戶評分模塊,用于基于所述初選用戶群中用戶在不同場景的行為數據,對所述初選用戶群中用戶進行多場景綜合評分;第二用戶篩選模塊,用于根據所述初選用戶群中用戶的綜合分值,從所述初選用戶群中用戶在不同場景的行為數據中選取正樣本和負樣本;模型構建模塊,用于通過所述正樣本和所述負樣本引導機器學習模型進行訓練,由完成訓練的機器學習模型構建得到用于實現目標用戶預測的用戶挖掘模型。
根據本發明公開的另一方面,一種用戶挖掘裝置,包括:行為數據獲取模塊,用于獲取待挖掘用戶群中用戶在不同場景的行為數據;目標用戶預測模塊,用于調用用戶挖掘模型,對所述待挖掘用戶群中用戶在不同場景的行為數據進行目標用戶預測,得到目標用戶群;其中,所述用戶挖掘模型是通過正樣本和負樣本引導機器學習模型訓練得到的,所述正樣本和所述負樣本與所述待挖掘用戶群中用戶在多場景行為融合中的綜合分值有關。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201910010777.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:數據處理系統
- 下一篇:一種基于特征碼對特定群體人員的分析方法及系統





