[發明專利]基于隨機森林和決策樹的優質客戶優化識別方法及裝置在審
| 申請號: | 201810028008.7 | 申請日: | 2018-01-11 |
| 公開(公告)號: | CN108388974A | 公開(公告)日: | 2018-08-10 |
| 發明(設計)人: | 李云亭;張洪利;榮以平;朱偉義;劉霄慧;尹明立;粱波;姜云;王偉;劉昳娟;王鑫 | 申請(專利權)人: | 國網山東省電力公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06Q50/06 |
| 代理公司: | 濟南圣達知識產權代理有限公司 37221 | 代理人: | 張勇 |
| 地址: | 250001 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 客戶 隨機森林 樣本 價值特征 客戶識別 決策樹 優化 決策樹算法 有效性分析 精準定位 客戶數據 判斷結果 大數據 優質性 構建 監督 | ||
1.一種基于隨機森林和決策樹的優質客戶優化識別方法,其特征在于,包括以下步驟:
獲取樣本客戶價值特征,并進行樣本客戶的優質性判別;
采用樣本客戶數據,基于隨機森林和決策樹算法進行訓練,構建優質客戶識別模型;
基于專家監督法對優質客戶識別模型的判斷結果進行有效性分析,并基于分析結果訓練優質客戶優化識別模型;
將待識別客戶的價值特征作為輸入,基于所述優質客戶優化識別模型,判斷所述客戶是否為優質客戶。
2.如權利要求1所述的一種基于隨機森林和決策樹的優質客戶優化識別方法,其特征在于,所述獲取樣本客戶價值特征并進行樣本客戶的優質性判別的具體步驟包括:
選擇樣本客戶,獲取樣本客戶的用戶各項用電信息,并對其影響客戶綜合價值進行分析,構建多維度的客戶價值評價特征指標體系;
根據所述指標體系統計樣本客戶的價值特征,并進行樣本客戶優質性判別。
3.如權利要求1或2所述的一種基于隨機森林和決策樹的優質客戶優化識別方法,其特征在于,所述獲取樣本客戶價值特征中價值特征包括用戶對應的基本屬性、經濟價值、負荷價值、發展價值、信用價值、行業價值數據。
4.如權利要求1所述的一種基于隨機森林和決策樹的優質客戶優化識別方法,其特征在于,所述采用樣本客戶數據,基于隨機森林和決策樹算法進行訓練,構建優質客戶識別模型的具體步驟包括:
對樣本客戶數據進行預處理;
基于隨機森林法構建優質客戶判斷模型;
基于決策樹算法構建優質客戶業務規則釋義模型;
采用預處理后的樣本客戶數據對優質客戶判斷模型和優質客戶業務規則釋義模型進行模型訓練,構建優質客戶識別模型。
5.如權利要求4所述的一種基于隨機森林和決策樹的優質客戶優化識別方法,其特征在于,所述對樣本客戶數據進行預處理的具體步驟包括:數據清洗、特征因素量化、特征拓展、特征選擇和異常值處理。
6.如權利要求5所述的一種基于隨機森林和決策樹的優質客戶優化識別方法,其特征在于,所述數據清洗為通過數據超限值檢驗、特征有效性檢驗和數據空值檢驗,對數據進行清洗;
所述數據超限值檢驗為檢查樣本客戶數據中用電量和電費電價均為0的記錄并予以刪除;所述特征有效性檢驗為檢查樣本客戶數據中用戶重要性特征信息過于單一的記錄;所述數據空值檢驗為檢查暫停天數字段全空和電費回款逾期天數缺失嚴重的記錄。
7.如權利要求4所述的一種基于隨機森林和決策樹的優質客戶優化識別方法,其特征在于,所述采用預處理后的樣本客戶數據對優質客戶判斷模型和優質客戶業務規則釋義模型進行模型訓練的具體步驟包括:依次進行全特征訓練、重要特征訓練、全特征交叉訓練和重要特征交叉訓練;
所述全特征訓練:樣本選取全部樣本客戶數據,模型入參為全部業務指標;
所述重要特征訓練:樣本選取全部樣本客戶數據,模型入參為重要性高的前40%指標;
所述全特征交叉訓練:將樣本客戶數據平均拆分成10份,每次選擇其中9份作為訓練樣本,剩余1份作為預測樣本,循環迭代10次,模型入參為全部業務指標;
所述重要特征交叉訓練:將樣本客戶數據平均拆分成10份,每次選擇其中9份作為訓練樣本,剩余1份作為預測樣本,循環迭代10次,模型入參為重要性高的前40%指標。
8.如權利要求4所述的一種基于隨機森林和決策樹的優質客戶優化識別方法,其特征在于,在模型訓練前,所述方法還包括:采用MDA法和MDG法相結合的方式選取重要性指標,通過模型訓練,得到指標重要性分析結果。
9.一種基于隨機森林和決策樹的優質客戶優化識別裝置,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述程序時實現如權利要求1-8任一項所述的方法。
10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執行時執行如權利要求1-8任一項所述的一種基于隨機森林和決策樹的優質客戶優化識別方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網山東省電力公司,未經國網山東省電力公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201810028008.7/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





