[發明專利]基于隨機森林算法的植被指數預測方法、系統及設備有效
| 申請號: | 201910905230.5 | 申請日: | 2019-09-24 |
| 公開(公告)號: | CN110826764B | 公開(公告)日: | 2020-11-24 |
| 發明(設計)人: | 荊文龍;李勇;劉楊曉月;楊驥;夏小琳 | 申請(專利權)人: | 廣州地理研究所 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q10/06;G06Q50/02;G06F16/28 |
| 代理公司: | 廣州駿思知識產權代理有限公司 44425 | 代理人: | 潘桂生 |
| 地址: | 510075 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 隨機 森林 算法 植被 指數 預測 方法 系統 設備 | ||
本發明涉及一種基于隨機森林算法的植被指數預測方法、系統及設備,通過以植被指數作為因變量,以全球陸地數據同化系統流域地表模型數據集和高程數據作為自變量,構建隨機森林模型,利用隨機森林模型對所述樣本數據進行分類并根據所述分類結果回歸預測目標時間段的植被指數,獲取植被指數預測值。相對于現有技術,本發明解決了現有技術中植被指數缺失問題,用戶可利用本發明實現任意時間段的植被指數預測,完善了植被指數數據。
技術領域
本發明涉及地理信息技術領域,尤其是涉及一種基于隨機森林算法的植被指數預測方法、系統及設備。
背景技術
植被指數是從多光譜遙感數據中提取的、能夠有效度量地表植被狀況的數值,是基于連續時間序列的衛星遙感數據,與植被的覆蓋度、生物量等有較好的相關性。
然而,現有的植被指數數據涉及的時間周期較短,而長時間的植被指數在反應區域地表植被情況及周期性變化及研究區域生態環境承載力上具有重要作用。然而,由于植被指數數據量大,數據維度多,對植被指數進行預測時,選擇所述植被指數中的特征顯得尤為重要,其選擇結果影響預測結果,影響預測的準確性。
發明內容
本發明的目的在于克服現有技術的缺點與不足,提供一種無需進行特征選擇、準確率高的基于隨機森林算法的植被指數預測方法、系統及設備。
一種基于隨機森林算法的植被指數預測方法,包括以下步驟:
獲取植被指數數據,選取預設時間段內的所述植被指數數據作為訓練數據集,根據預設的規則從所述訓練數據集選取高質量像元值作為第一輸入數據;
將預設時間段內的全球陸地數據同化系統流域地表模型數據集以每半月進行整合,生成半月尺度的第二輸入數據;
獲取預設時間段內的高程數據,以植被指數作為因變量,以全球陸地數據同化系統流域地表模型數據集和高程數據作為自變量,構建隨機森林模型;
其中,所述隨機森林模型通過在訓練數據集中隨機有放回抽取若干個子集,每個子集生成一棵分類與回歸樹,利用最優變量及對應的最優值對所述分類與回歸樹進行劃分,通過對若干個分類與回歸樹的預測值進行平均獲得植被指數預測值;
獲取目標時間段的全球陸地數據同化系統流域地表模型數據,將所述第一輸入數據、第二輸入數據、高程數據和目標時間段的全球陸地數據同化系統流域地表模型數據作為隨機森林模型的樣本數據,利用隨機森林模型對所述樣本數據進行分類并根據所述分類結果回歸預測目標時間段的植被指數,獲取植被指數預測值。
相對于現有技術,本發明通過以植被指數作為因變量,以全球陸地數據同化系統流域地表模型數據集和高程數據作為自變量,構建隨機森林模型,利用隨機森林模型對所述樣本數據進行分類并根據所述分類結果回歸預測目標時間段的植被指數,獲取植被指數預測值,所述隨機森林通過隨機選取特征遍歷減少每棵樹之間的相關性,提高每棵樹之間的分類精度,實現了任意時間段的植被指數預測,解決了現有技術中植被指數缺失問題,用戶可利用本發明完善植被指數數據,同時本發明為多棵分類與回歸樹并行計算,計算效率高,最終結合多棵分類與回歸樹的預測結果進行植被指數的預測,準確性較高。
在本發明一個實施例中,所述以植被指數作為因變量,以全球陸地數據同化系統流域地表模型數據集和高程數據作為自變量,構建隨機森林模型的步驟包括:
在訓練數據集中隨機有放回抽取子集,每個子集生成一棵分類與回歸樹;
利用最優變量st和對應最優值s*將t節點劃分為tL和tR兩棵子樹,令每棵子樹之間的樣本具有最大差異性:
Δi(s,t)=i(t)-pLi(tL)-pRi(tR)
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州地理研究所,未經廣州地理研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201910905230.5/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





