[發明專利]基于遺傳編程的多元回歸預測模型優化方法在審
| 申請號: | 201710227808.7 | 申請日: | 2017-04-10 |
| 公開(公告)號: | CN107145964A | 公開(公告)日: | 2017-09-08 |
| 發明(設計)人: | 黃震華 | 申請(專利權)人: | 同濟大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04 |
| 代理公司: | 上海科律專利代理事務所(特殊普通合伙)31290 | 代理人: | 葉鳳 |
| 地址: | 200092 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 遺傳 編程 多元 回歸 預測 模型 優化 方法 | ||
技術領域
本發明涉及一種多元回歸預測模型優化方法,尤其是涉及一種基于遺傳編程的多元回歸預測模型優化方法。
背景技術
近年來,多元回歸預測模型及其優化技術是信息服務學科的一個研究熱點和重點,它廣泛應用于智能交通、電子商務、生物信息、醫療健康和社會公共安全等領域。多元回歸預測是指通過對兩個或兩個以上的自變量與一個因變量的相關分析,建立預測模型進行預測的方法。它的通用數學模型可以表示為:
其中,y表示因變量,為模型的預測值,x1~xn為n個與因變量緊密相關的自變量,代表n個不同的抽象特征或影響因素,a1~an為n個自變量的系數,即模型的n個參數,r1~rn為自變量x1~xn的次冪。當r1=r2=…=rn=1時,該模型為多元線性回歸預測模型。在實際應用中,通常都會涉及到多元非線性回歸預測模型,即r1~rn中,至少有一個次冪大于1。
目前多元回歸預測模型的檢驗主要有如下六種方式:1)模型擬合程度測定,2)標準誤差評估,3)回歸方程的顯著性檢驗,4)回歸系數的顯著性檢驗,5)多重共線性判別以及6)杜賓-瓦特森(D-W:Durbin-Watson)檢驗。
在實際應用中,與支持向量機(SVM:Support Vector Machine)、人工神經網絡(ANN:Artificial Neural Network)、隨機森林(RF:Random Forest)、貝葉斯網絡(BN:Bayesian Network)、隱馬爾可夫模型(HMM:Hidden Markov Model)等預測方法相比,基于多元回歸模型預測模型的預測方法具有簡單方便、靈活以及速度快等優點。但是現有的模型優化方法仍然存在準確度不高、容易過擬合以及泛化能力弱等缺陷。
發明內容
本發明的目的就是為了克服上述現有技術存在的缺陷而提供一種基于遺傳編程策略、高效且泛化能力強的多元回歸預測模型優化方法,技術框架如圖1所示。
本發明主要由初始多元回歸預測模型簇構造和多元回歸預測模型簇進化兩個模塊組成。
所述初始多元回歸預測模型簇構造模塊,通過2個步驟來實現:
步驟1.1:多元回歸預測模型簇生成。從輸入端獲取所要預測問題的w個影響因素以及模型個體數量參數值m(m為正整數),順序產生m個多元回歸預測模型個體分別表示為:其中y[z](1≤z≤m)為第z個模型個體的因變量,即該模型個體的預測值;n[z]為第z個模型個體的自變量個數,且n[z]≤w;a[z]i為第z個模型個體第i(1≤i≤n[z])個自變量的系數;r[z]i為第z個模型個體第i個自變量的次冪。每個模型個體中的自變量均取自且不重復。從而,這m個多元回歸預測模型個體構成一個集合PM,即為多元回歸預測模型簇。
步驟1.2:簇內各模型個體參數優化。從輸入端獲取數據樣本集合其中每個數據樣本均由和兩部分組成,為w個影響因素的取值,為實際預測值。然后,對于PM中的每一個模型個體基于Ψ,對中的n[z]個自變量系數a[z]1~a[z]n[z]進行迭代優化,并最終產生最優的多元回歸預測模型個體。
所述多元回歸預測模型簇進化模塊,通過5個步驟來實現:
步驟2.1:多元回歸預測模型簇選擇。從輸入端獲取選擇率的取值s(0<s<1)和數據樣本集合計算模型簇PM中每個模型個體的預測準確度,并從中選取個預測準確度最高的模型個體,將它們組成集合OM,表示取上限整數,并從PM中刪除OM中的模型個體。
步驟2.2:多元回歸預測模型簇解析。以步驟2.1中的模型簇PM為輸入,對于其中的每一個模型個體將其轉換成一棵二叉解析樹BP[z]。BP[z]需要同時滿足如下6個條件:1)任一個節點至多包含兩個子節點,2)左葉子節點為自變量系數,3)右葉子節點為自變量及其次冪,4)葉子節點的父節點為乘法運算(即“×”號),5)其余節點為加法運算(即“+”號),6)右葉子節點關聯中的一個影響因素標識符。從而,當所有模型個體轉換完畢之后,將得到PM所對應的二叉解析樹集合BM。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于同濟大學,未經同濟大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201710227808.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種新型空氣源熱泵機組化霜管道
- 下一篇:一種便于安裝的中繼器
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





