[發明專利]一種基于機器學習的零售終端樣本抽樣方法在審
| 申請號: | 202010972202.8 | 申請日: | 2020-09-16 |
| 公開(公告)號: | CN112115129A | 公開(公告)日: | 2020-12-22 |
| 發明(設計)人: | 周凱 | 申請(專利權)人: | 浪潮軟件股份有限公司 |
| 主分類號: | G06F16/215 | 分類號: | G06F16/215;G06K9/62;G06N20/00;G06Q30/02 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 馮春連 |
| 地址: | 250100 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 機器 學習 零售 終端 樣本 抽樣 方法 | ||
1.一種基于機器學習的零售終端樣本抽樣方法,其特征在于,該方法包括如下內容:
S1、數據采集階段:采集某區域零售終端的零售戶基本信息及銷售數據;
S2、數據清洗階段:基于零售戶的基本信息及銷售數據,設定閾值,對零售戶進行清洗,去除異常零售戶;
S3、特征選取階段:根據所采集的零售戶基本信息及銷售數據,選取既有特征或自定義特征;
S4、數據分層階段:基于機器學習算法,根據零售戶的既有特征或自定義特征,確定樣本分層數;
S5、樣本選取階段:基于零售戶的銷售數據,獲取該零售戶的購進量,進而確定每層樣本量并隨機抽樣得出樣本列表;
S6、替換樣本預備階段:將經過數據清洗階段的零售戶劃分為樣本零售戶組和非樣本零售戶組,以每一樣本零售戶為質心,計算與該樣本零售戶同一分層下所有零售戶與該樣本零售戶的距離,選定多個替換樣本并存儲于替換樣本庫。
2.根據權利要求1所述的一種基于機器學習的零售終端樣本抽樣方法,其特征在于,在步驟S1的數據采集階段,
某區域的零售終端選取可支持線上銷售的設備,包括但不限于電腦和手機;
零售戶的基本信息及銷售數據包括且不限于零售戶的檔位、類型、區域、銷售筆數、銷量、銷額、期末庫存、購進量各信息。
3.根據權利要求2所述的一種基于機器學習的零售終端樣本抽樣方法,其特征在于,在步驟S2的數據清洗階段,根據步驟S1采集的零售戶基本信息及銷售數據,對對各項銷售指標設定閾值,根據設定的閾值,過濾去掉銷售數據異常的零售戶。
4.根據權利要求3所述的一種基于機器學習的零售終端樣本抽樣方法,其特征在于,在步驟S3的特征選取階段,
所述既有特征是基于所采集零售戶基本信息及銷售數據直接得到的特征數據,包括且不限于包括銷量、結余庫存、銷售筆數、銷售金額、在線時長;
所述自定義特征是基于所采集零售戶基本信息及銷售數據人工計算或總結得到的特征數據,包括且不限于包括存銷比、掃碼集中度、時間擬合度。
5.根據權利要求4所述的一種基于機器學習的零售終端樣本抽樣方法,其特征在于,在步驟S4的數據分層階段,基于K-Means算法或神經網絡算法,對既有特征或自定義特征進行歸一化操作,去除奇異值,加速收斂過程,確定樣本分層數。
6.根據權利要求5所述的一種基于機器學習的零售終端樣本抽樣方法,其特征在于,在步驟S5的樣本選取階段,將經過數據清洗階段的零售戶作為總體樣本量按比例分配至各層,對各層零售戶分別確定樣本量,然后基于規則在每層中進行樣本選取,其中,樣本選取規則可采用等距隨機抽樣或簡單隨機抽樣。
7.根據權利要求6所述的一種基于機器學習的零售終端樣本抽樣方法,其特征在于,每個樣本的替換樣本須與該樣本屬于同一層,各樣本的替換樣本可以重復,但是進行替換后該替換樣本不可再次替換,保證樣本庫的互異性。
8.根據權利要求7所述的一種基于機器學習的零售終端樣本抽樣方法,其特征在于,當增加樣本或進行樣本替換后應與原樣本列表進行對比,偏離度需滿足一定誤差范圍。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浪潮軟件股份有限公司,未經浪潮軟件股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202010972202.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:音頻翻譯方法和系統
- 下一篇:一種自清理式高效逆止閥





