[發明專利]一種基于大數據的房屋價格自動評估方法在審
| 申請號: | 201811445064.7 | 申請日: | 2018-11-29 |
| 公開(公告)號: | CN109685547A | 公開(公告)日: | 2019-04-26 |
| 發明(設計)人: | 嚴志民;梁麗燕;陳再蝶;陳璐;黃晨鳴 | 申請(專利權)人: | 杭州中房信息科技有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06F16/215;G06F16/2458;G06F16/28 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 傅朝棟;張法高 |
| 地址: | 310052 浙江省杭州*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 房屋價格 自動評估 大數據 價格信息數據庫 測試 典型場景 房屋特征 估算模型 近鄰算法 理論支撐 數據清洗 特征變量 循環比較 樣本房屋 影響房屋 自動收集 相似度 房屋 數據庫 估算 量化 分類 評估 改進 | ||
1.一種基于大數據的房屋價格自動評估方法,其特征在于包括以下步驟:
1)通過網頁抓取和GIS技術自動收集各小區的房屋交易信息及其房屋特征數據,所述房屋交易信息為房屋的價格信息,所述房屋特征數據包括建筑特征、小區特征和位置坐標;
2)將所有收集到的數據進行清洗分類,并對房屋特征數據進行量化后得到房屋的特征變量數據,建立房屋特征變量-價格信息數據庫;
3)基于改進的KNN近鄰算法計算測試房屋對象的價格,具體計算過程包括:3-1)循環計算測試房屋對象和數據庫中每個樣本房屋對象的特征變量相似度,所述相似度計算使用歐幾里得距離d,計算公式如下:
其中n為房屋的特征變量數量,ai和bi分別表示測試房屋a和樣本房屋b的第i個特征;
3-2)使用TopK算法改進最近鄰查找,首先隨機建立一個大小為k的堆,堆中元素的值初始化為0;之后將數據庫中所有樣本房屋對象與測試房屋對象的d值逐個與堆中元素的值進行比較,若大于則將該d值放入堆中,若不大于則繼續遍歷,直到遍歷結束得到測試房屋對象的k個最鄰近樣本房屋對象;
3-3)對上一步得到的k個最鄰近樣本房屋對象進行加權計算得到測試房屋對象的價格估值P,計算分兩種情況:當d存在零值時,P取k個最鄰近樣本房屋對象的算術平均值;當d不存在零值時,P為最鄰近樣本房屋對象的價格乘權的總和與對應權值總和的比值;具體計算公式如下:
其中wm為第m個最鄰近樣本房屋對象的權值,其價格為pm,其相似度為dm;4)輸出房源價格評估結果。
2.根據權利要求1所述的一種基于大數據的房屋價格自動評估方法,其特征在于步驟1)中所述的價格信息包括掛牌價格、簽約價格;所述的建筑特征包括建筑面積、房齡、當前層、總層數、性質;所述的小區特征包括外部資源即教育配套、醫療資源、菜場、公交、地鐵、公園、湖泊、商業綜合體和內部環境即綠化率、內部設施;所述的位置坐標為經緯度。
3.根據權利要求1所述的一種基于大數據的房屋價格自動評估方法,其特征在于步驟1)中所述的自動收集的數據來源包括中介網站、百度地圖和自有渠道。
4.根據權利要求3所述的一種基于大數據的房屋價格自動評估方法,其特征在于所述的中介網站包括鏈家網、我愛我家、中原、華邦、中聯、搜房、58同城和安居客。
5.權利要求1所述的一種基于大數據的房屋價格自動評估方法,其特征在于步驟2)所述的對房屋特征數據進行量化步驟如下:
2-1)小區性質分類:將小區性質分類分為住宅、商業及工業三大類和細分類別;
2-2)評分評價:對小區周邊學區、醫院和商業配套進行評分;
2-3)距離量化及標準化:對小區到周邊環境的距離進行量化,并采取標準化手段進行統一,所述周邊環境包括公園、河流、湖泊;
2-4)經緯度轉化:將小區經緯度轉化為區域劃分的區域等級。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州中房信息科技有限公司,未經杭州中房信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201811445064.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:促銷價格最優計算方法
- 下一篇:一種智能穿戴設備積分產生的方法





