[發明專利]一種基于機器學習的零售終端樣本抽樣方法在審
| 申請號: | 202010972202.8 | 申請日: | 2020-09-16 |
| 公開(公告)號: | CN112115129A | 公開(公告)日: | 2020-12-22 |
| 發明(設計)人: | 周凱 | 申請(專利權)人: | 浪潮軟件股份有限公司 |
| 主分類號: | G06F16/215 | 分類號: | G06F16/215;G06K9/62;G06N20/00;G06Q30/02 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 馮春連 |
| 地址: | 250100 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 機器 學習 零售 終端 樣本 抽樣 方法 | ||
本發明公開一種基于機器學習的零售終端樣本抽樣方法,涉及數據處理技術領域,其包括:采集某區域零售終端的零售戶基本信息及銷售數據;基于零售戶的基本信息及銷售數據,設定閾值,清洗去除異常零售戶;根據所采集的零售戶基本信息及銷售數據,選取既有特征或自定義特征;基于機器學習算法,根據零售戶的既有特征或自定義特征,確定樣本分層數;基于零售戶的銷售數據,獲取購進量,確定每層樣本量并隨機抽樣得出樣本列表;將清洗后的零售戶劃分為樣本零售戶組和非樣本零售戶組,以每一樣本零售戶為質心,計算同層其余零售戶與該樣本零售戶的距離,選定多個替換樣本并存儲于替換樣本庫。本發明可以提高分層的準確性和分析的魯棒性。
技術領域
本發明涉及數據處理技術領域,具體的說是一種基于機器學習的零售終端樣本抽樣方法。
背景技術
隨著現代零售終端的不斷發展,客戶數和客戶質量越來越高,利用好這些數據的價值就能得到對市場環境的清醒洞察,從而便于企業進一步有效制定營銷手段、進行貨品精準投放、指導現代終端客戶合理布局等策略。但是零售客戶眾多,信息量龐大且信息內容參差不齊,分析起來較為困難,而對部分優質客戶的分析便能還原出整體的市場狀態,所以,如何從龐大的零售客戶中選出優質樣本顯得尤為重要。
目前對于零售終端樣本選取的方法中,大多還是使用簡單隨機抽樣方法或分層抽樣方法。使用簡單隨機抽樣方法將會忽略樣本的特殊性,存在數據代表性不足的缺點,分層抽樣方法雖然彌補了簡單隨機抽樣方法的缺點,但分層的合理性嚴重影響著分析結果的正確性,依然存在較大的改進空間。故需要結合樣本較為全面的特征,開發一整套樣本抽樣與維護的方法,從而能在一個較為準確的起點開展對市場狀況的分析。
發明內容
本發明為了克服現有零售終端樣本抽樣方法存在的數據代表性不足、分層可靠性較低等不足,提供一種基于機器學習的零售終端樣本抽樣方法。
本發明的一種基于機器學習的零售終端樣本抽樣方法,解決上述技術問題采用的技術方案如下:
一種基于機器學習的零售終端樣本抽樣方法,該方法包括如下內容:
S1、數據采集階段:采集某區域零售終端的零售戶基本信息及銷售數據;
S2、數據清洗階段:基于零售戶的基本信息及銷售數據,設定閾值,對零售戶進行清洗,去除異常零售戶;
S3、特征選取階段:根據所采集的零售戶基本信息及銷售數據,選取既有特征或自定義特征;
S4、數據分層階段:基于機器學習算法,根據零售戶的既有特征或自定義特征,確定樣本分層數;
S5、樣本選取階段:基于零售戶的銷售數據,獲取該零售戶的購進量,進而確定每層樣本量并隨機抽樣得出樣本列表;
S6、替換樣本預備階段:將經過數據清洗階段的零售戶劃分為樣本零售戶組和非樣本零售戶組,以每一樣本零售戶為質心,計算與該樣本零售戶同一分層下所有零售戶與該樣本零售戶的距離,選定多個替換樣本并存儲于替換樣本庫。
可選的,在步驟S1的數據采集階段,
某區域的零售終端選取可支持線上銷售的設備,包括但不限于電腦和手機;
零售戶的基本信息及銷售數據包括且不限于零售戶的檔位、類型、區域、銷售筆數、銷量、銷額、期末庫存、購進量各信息。
可選的,在步驟S2的數據清洗階段,根據步驟S1采集的零售戶基本信息及銷售數據,對對各項銷售指標設定閾值,根據設定的閾值,過濾去掉銷售數據異常的零售戶。
可選的,在步驟S3的特征選取階段,
所述既有特征是基于所采集零售戶基本信息及銷售數據直接得到的特征數據,包括且不限于包括銷量、結余庫存、銷售筆數、銷售金額、在線時長;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浪潮軟件股份有限公司,未經浪潮軟件股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202010972202.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:音頻翻譯方法和系統
- 下一篇:一種自清理式高效逆止閥





