[發明專利]一種面向流行病防控的大規模人口接觸網絡建模方法有效
| 申請號: | 202010065785.6 | 申請日: | 2020-01-20 |
| 公開(公告)號: | CN111145917B | 公開(公告)日: | 2021-05-04 |
| 發明(設計)人: | 羅暉 | 申請(專利權)人: | 羅暉 |
| 主分類號: | G16H50/80 | 分類號: | G16H50/80;G16H40/00;G06Q50/26;G06F16/22;G06F16/2458 |
| 代理公司: | 北京高航知識產權代理有限公司 11530 | 代理人: | 鄭華麗 |
| 地址: | 510030 廣東省廣州市越*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 流行病 大規模 人口 接觸 網絡 建模 方法 | ||
1.一種面向流行病防控的大規模人口接觸網絡建模方法,其特征在于,包括:
采用張量M∈RG×G×T建模動態人口接觸網絡,其中采用空間RG×G×T的基底表示動態人口接觸網絡的空間模式,采用基底的線性組合系數W=(w1,…,wR)表示動態人口接觸網絡的時間模式;
構建包含多個虛擬場景的虛擬社會;并基于所述虛擬場景計算各場景中各虛擬個體之間的交互概率,構成動態人口接觸網絡的空間模式其中表示場景r下各虛擬個體之間的接觸概率;
根據選定的流行病傳播模型以及相應的病理學參數,結合所述動態人口接觸網絡建立獲取動態人口接觸網絡時間模式的優化目標函數;使用雙重迭代優化算法求解估算動態人口接觸網絡時間模式W={w1,…,wR},其中wr表示場景r下各虛擬個體之間的接觸強度;
所述方法還包括,基于包括人口普查數據、公交信息卡數據、社會醫院統計信息的多元數據構建虛擬社會,其中所述虛擬社會包含家庭、學校、工作、通勤、醫院、公共場所的虛擬場景;
其中,構建所述虛擬社會的方法包括:
虛擬行政區:根據人口普查數據中的行政區域劃分和各個行政區內的人口統計數據,建立虛擬行政區,為每個虛擬行政區分配相應數量的虛擬個體;根據各個行政區性別比例和年齡分布數據,為各虛擬行政區中的虛擬個體指定性別和年齡;
虛擬家庭:根據各行政區家庭戶數統計數量為每個虛擬行政區分配相應數量的家庭;根據戶主年齡分布、家庭成員數量和家庭組成結構等統計數量將每個虛擬個體分配到不同的虛擬家庭中;
虛擬校園:根據各行政區包含學校數量和種類的統計數據,為每個虛擬行政區分配相應數量和種類的學校;根據學校類型、人數、位置及就讀率等統計數據為每個適齡虛擬個體分配就讀學校;
虛擬工作場所:依據各行政區的就業率數據將適齡虛擬個體指定為就業或賦閑狀態;根據工作區域與生活區域的聯合分布數據為就業個體分配虛擬工作區域,根據行業類型和個體年齡的聯合分布數據為就業個體指定虛擬工作類型;
虛擬通勤軌跡:根據交通信息卡數據,從中得到每張交通信息卡的移動路線,進而根據交通信息卡的注冊資料,為每個虛擬個體構造出相應的虛擬通勤軌跡;
虛擬社區醫院:根據各行政區社區醫院和診所基本統計信息,將各虛擬行政區中的個體分配到不同的虛擬醫院和診所中;
所述方法還包括:采用復合人口模型表示不同場景下的接觸結構,依據虛擬社會中個體的年齡,每5歲一組,將0到85歲的個體劃分為17個年齡組中,將85歲以上的個體劃分到第18個年齡組中,將每個虛擬場景的群體接觸結構建模為一個18×18的二維矩陣,以描述不同年齡組之間的接觸概率;其中不同場景內各年齡組之間的接觸概率由以下函數獲得:
式中,表示r場景下年齡組i和年齡組j之間的接觸概率,nu,nv分別表示場景r中年齡組u和年齡組v中的人數,對于年齡組u中的個體i,表示i所在的場景r中的總人數,表示i所在場景r中年齡組v中的人數;
針對社區醫院場景的接觸信息的獲取方法包括:1)從醫院中抽樣選擇醫生、護士、病人、保潔和護理人員作為目標對象,同時為每個目標設置唯一ID,其中包含年齡、職位、性別等信息,在目標對象身上的智能設備中預裝有藍牙程序;設置該藍牙程序的掃描間隔和掃描范圍,藍牙程序按照設置的掃描間隔和掃描范圍掃描其他預裝有該藍牙程序的藍牙設備,若在掃描范圍內掃描其他藍牙設備,則認為目標對象之間產生接觸,記錄所有的接觸事件;
基于上述采集的接觸事件信息,計算社區醫院場景下的接觸概率,其中采用的接觸概率函數為:
式中,表示社區醫院場景下年齡組u和年齡組v之間的接觸概率,F(i,j)和T(i,j)分別表示個體u和個體v的接觸次數和累積時長;
針對通勤軌跡場景的接觸信息的獲取方法包括:1)首先為群其中每個個體構造出虛擬的通勤軌跡,包括:乘坐車輛、乘車時間、乘車區間等;2)通過設計的算法檢索出個體間的接觸事件,匹配出同時乘坐統一通勤車輛的個體對;3)結合交通卡的相關注冊信息,計算出通勤場景中不同年齡組間的接觸概率;具體包括:
將虛擬社會內的公共交通工具設置為公交車和地鐵兩大類;
針對公交車的通勤信息,通過公交車信息卡的刷卡時間記錄上車的時間和地點,同時,結合虛擬個體的身份信息推測出乘車目的,進而結合沿途各站的附近設施信息與人口密度信息推測出其下車地點和乘車時間;基于個體上下車的時間和地點,結合所乘公交車的運營線路,為個體建立虛擬的公交車通勤軌跡;
針對地鐵的通勤信息,通過公交信息卡的進出站刷卡數據記錄進站和出站的地點和時間,同時考慮進站和出站之間的地鐵運行軌跡,可得出該進出站之間的換乘車站的停留信息;通過結合刷卡數據和地鐵運營線路可為個體建立虛擬的地鐵通勤軌跡;
所述方法還包括:采用稀疏的表示方式對W進行建模,對wr進行稀疏表示為其中
式中,表示t時刻場景r中接觸強度的變化量,wr(t)表示t時刻r場景內的接觸強度;可得
采用表示人口接觸結構的時間模式;
所述方法還包括:根據所述基底獲取張量M的分解模型,包括:
其中,中每個基底元素是一個G×G矩陣,G表示總人口劃分為亞人群的分組個數,每個基底矩陣表示不同場景中的接觸模式
采用Mt表示張量M在t時刻的快照,表示t時刻G個年齡組的人口的接觸結構,其中Mt的表示函數為:
式中,表示t時刻的線性組合系數,可以表達t時刻各場景內的接觸強度變化量;
將基底中的每個基底元素表示為兩個特征向量的外積形式:
其中,Ur和Vr∈RG;
采用矩陣的表示方式,將M表示為如下的外積形式:
式中,M表示張量,“·”表示為二維矩陣和一維向量生成三維矩陣的外積運算;和表示各場景的特征矩陣;
其中采用的流行病傳播模型為:
It=KtIt-1=StABtCIt-1
式中,向量It表示t時刻各個年齡組的新增病例數,K表示再生矩陣,向量It和對角矩陣St分別表示t時刻的感染人數和尚未被感染的易感人數;矩陣A和C表示兩個基本的流行病學參數,分別表示未感染者的易感程度和已感染者的感染能力;Bt表示t時刻的接觸矩陣,Bt(i,j)表示t時刻亞人群i和亞人群j的接觸概率,與人口動態接觸結構M對應;
其中,根據選定的流行病傳播模型以及相應的病理學參數,結合所述動態人口接觸網絡建立獲取動態人口接觸網絡時間模式的優化目標函數為:
其中
U和V滿足
式中,N表示設定的流行病種類的總數,T表示動態人口接觸網絡時間窗的長度,表示第i種流行病在t時刻不同年齡組的新增病例數,其為流行病傳播模型生成的模擬數據,P表示總人口數,Ai和Ci分別表示第i種流行病中兩個基本的流行病學參數,Ur和Vr表示場景r下的特征矩陣,表示t′時刻r場景下的接觸強度變化量,Ω1,…,ΩR表示基底矩陣中具有數據項的位置,ε表示松弛參數,表示r場景下年齡組u和年齡組v之間的接觸概率;
采用參數優化算法優化上述目標函數,獲取人口接觸網絡時間模式
所述方法還包括:采用基于雙重迭代參數優化算法求解估算動態人口接觸網絡時間模式包括:
根據動態人口接觸網絡時間模式的優化目標函數以及約束條件構造一個Lagrange方程:
式中,L表示構造的Lagrange方程,αr表示針對不同場景下特征向量的約束系數,γ和ρ約束條件的約束系數;
采用Lasso稀疏優化技術針對上述Lagrange方程構造優化算法;在該優化過程中,需要計算L關于各變量的偏導數和而在計算上述偏導數時,需要計算流行病模型集合F中各個流行病模型關于它們的偏導數和令是各流行病模型集合F基于U,V,所產生的模擬數據;在計算偏導數和會用到的值,于是這些偏導數可以表示成與有關的形式:
基于以上分析,可得到一個基于流行病模型的雙重迭代稀疏優化算法;在一重迭代中,基于當前的參數U,V,模擬N種流行病爆發,產生模擬數據在另一重迭代中,基于新產生的模擬數據計算L關于各變量的偏導數和進而采用Lasso技術處理L以更新參數U,V,重復執行以上過程直到收斂;獲取最終輸出的優化參數
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于羅暉,未經羅暉許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202010065785.6/1.html,轉載請聲明來源鉆瓜專利網。





