[發明專利]量化參數處理方法及裝置在審
| 申請號: | 202011601317.2 | 申請日: | 2020-12-30 |
| 公開(公告)號: | CN112561083A | 公開(公告)日: | 2021-03-26 |
| 發明(設計)人: | 申偉強;李驪 | 申請(專利權)人: | 北京華捷艾米科技有限公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 王嬌嬌 |
| 地址: | 100193 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 量化 參數 處理 方法 裝置 | ||
本申請提供了一種量化參數處理方法及裝置,獲取模型量化工具中包括的每個參數配置項、以及每個參數配置項對應的所有量化參數;將每個參數配置項對應的各個量化參數進行組合,得到多個量化參數組合;每個量化參數組合包括每個參數配置項中的任意一個量化參數;獲取待量化浮點型模型;針對每個量化參數組合,基于量化參數組合中的各個量化參數,調用模型量化工具對待量化浮點型模型進行量化處理,得到量化參數組合對應的量化模型;計算每個量化參數組合對應的量化模型的模型精度,并將各個模型精度中最高的或最低的模型精度對應的量化參數組合確定為目標量化參數組合。實現了確保所確定的目標量化參數組合是所有量化參數組合中的最優量化參數組合。
技術領域
本申請涉及深度學習技術領域,尤其涉及一種量化參數處理方法及裝置。
背景技術
隨著深度學習技術的不斷發展,基于深度學習的深度神經網絡模型被廣泛應用于各個領域,但在對深度神經網絡模型的實際部署中,仍然存在模型大,導致計算資源(例如CPU)消耗較大等問題,進而導致無法在終端設備或者邊緣設備上進行部署,因此,為了降低計算資源消耗,需要對神經網絡模型進行量化。
現有技術中,模型量化基于模型量化工具實現,模型量化工具設置有多個參數配置項,每個參數配置項對應有多個量化參數供用戶進行配置,用戶根據經驗從每個參數配置項對應的多個量化參數中選擇一個量化參數進行模型量化。由于需要配置的參數配置項、以及每一個參數配置項對應可選擇的量化參數較多,由此可形成多種量化參數組合,導致可能出現用戶所配置的量化參數組合不是最優的量化參數組合的情況,從而導致基于該量化參數組合所量化得到的量化模型精度非常低,無法滿足最小精度損失的模型量化需求。
發明內容
本申請提供了一種量化參數處理方法及裝置,目的在于解決量化參數組合較多,導致可能出現用戶所配置的量化參數組合不是最優的量化參數組合的情況,從而導致基于該量化參數組合所量化得到的量化模型精度非常低,無法滿足最小精度損失的模型量化需求的問題。
為了實現上述目的,本申請提供了以下技術方案:
一種量化參數處理方法,包括:
獲取模型量化工具中包括的每個參數配置項、以及每個參數配置項對應的所有量化參數;
將每個參數配置項對應的各個量化參數進行組合,得到多個量化參數組合;每個量化參數組合包括每個參數配置項中的任意一個量化參數;
獲取待量化浮點型模型;
針對每個量化參數組合,基于所述量化參數組合中的各個量化參數,調用所述模型量化工具對所述待量化浮點型模型進行量化處理,得到所述量化參數組合對應的量化模型;
計算每個量化參數組合對應的量化模型的模型精度,并將目標模型精度對應的量化參數組合確定為目標量化參數組合;所述目標模型精度為各個模型精度中最高的或最低的模型精度。
上述的方法,可選的,所述獲取模型量化工具中包括的每個參數配置項、以及每個參數配置項對應的所有量化參數,包括:
獲取預先生成的配置文件;所述配置文件中預先存儲模型量化工具中包括的每個參數配置項、以及每個參數配置項對應的所有量化參數;
對所述配置文件進行解析,以獲得所述模型量化工具中包括的每個參數配置項、以及每個參數配置項對應的所有量化參數。
上述的方法,可選的,所述基于所述量化參數組合中的各個量化參數,調用所述模型量化工具對所述待量化浮點型模型進行量化處理,得到所述量化參數組合對應的量化模型,包括:
針對所述量化參數組合中的每個量化參數,確定所述模型量化工具中與所述量化參數對應的寫入位置;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京華捷艾米科技有限公司,未經北京華捷艾米科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202011601317.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種速熱電熱水器
- 下一篇:一種腈水解活性專一性提高的腈水解酶突變體及其應用





