[發明專利]一種基于乳腺癌疾病的調控網絡構建及分析方法有效
| 申請號: | 201810972336.2 | 申請日: | 2018-08-24 |
| 公開(公告)號: | CN109243523B | 公開(公告)日: | 2021-06-11 |
| 發明(設計)人: | 王之瓊;曲璐渲;郭上慧;霍岳陽;高笑宇;錢唯 | 申請(專利權)人: | 東北大學 |
| 主分類號: | G16B5/00 | 分類號: | G16B5/00;G16B25/00 |
| 代理公司: | 沈陽東大知識產權代理有限公司 21109 | 代理人: | 劉曉嵐 |
| 地址: | 110819 遼寧*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 乳腺癌 疾病 調控 網絡 構建 分析 方法 | ||
1.一種基于乳腺癌疾病的基因調控網絡構建及分析方法,其特征在于,包括以下步驟:
步驟1:乳腺癌相關基因初步篩選:將乳腺癌基因分為基準基因、相關基因與篩選出的相關基因,基準基因指與乳腺癌疾病有關系的基因,相關基因指除基準基因以外所有基因,篩選出的相關基因指用如下方法篩選出與乳腺癌疾病關系緊密的基因,包括步驟1.1~步驟1.4:
步驟1.1:將基因表達數據分為兩個矩陣,X矩陣為乳腺癌基準基因的表達數據,Y矩陣是待篩選的其余乳腺癌相關基因的表達數據,在X矩陣與Y矩陣中,每一行為一個基因,每一列為一個樣本;
步驟1.2:矩陣Y中的向量Yj依次與X中的向量Xi計算每個基因之間的互信息值,Yj和Xi代表第j個和第i個基因的數據;
步驟1.3:人工選擇閾值Isn,若互信息值大于等于Isn,則向量Yj對應的基因添加到X矩陣中,并在矩陣Y中刪除,閾值Isn為動態選擇的數值,根據每一輪的互信息結果,對每輪的互信息的值大小進行排序,Isn即為當前輪中第sn個閾值,篩選出來互信息值最大的前sn個基因;
步驟1.4:重復步驟1.2至1.3,直到矩陣X中的基因數量達到預設定的值M個;
步驟2:基因調控網絡的構建:利用步驟1中獲得基因的表達數據矩陣X,通過BNFinder2工具進行調控網絡構建,設置調控節點集合的數量,評分函數為BDE評分函數,得到一個概率網絡,網絡節點代表基因,有向邊代表基因之間的調控關系;具體包括步驟2.1~步驟2.3:
步驟2.1:數據處理:根據X矩陣,確定基因個數及樣本數量,并為每個基因設定潛在調控基因;
步驟2.2:設定基因調控網絡結構的結構學習及參數學習,采用基于評分搜索的結構學習方法,遍歷所有可能的結構,然后用BDE評分函數衡量各個結構,進而找出最好的結構;具體包括步驟2.2.1~步驟2.2.4:
步驟2.2.1:對于某個基因,首先獲取該基因的潛在調控基因及其表達數據;
步驟2.2.2:為基因的每個潛在調控節點賦予權重;
步驟2.2.3:獲取調控基因為空集的基因的BDE分數;
步驟2.2.4:遍歷基因的潛在調控基因的集合,每次遍歷結果即為該基因的一種調控結構,計算該結構的BDE分數,存入到一個堆棧中,遍歷結束后,堆棧中留下的為評分最高的對應的調控基因的集合,堆棧堆的大小即為設定的調控節點集合的數量;
步驟2.3:根據網絡的學習結果整合調控關系,得到基因調控網絡結果;
步驟3:根據基因調控網絡結果,進行節點中心性分析,包括節點的度中心性,接近中心性,中介中心性和特征向量中心性,將BNFinder2得到的基因調控網絡,通過Python的擴展包networkx計算各個基因的度中心性,接近中心性,中介中心性和特征向量中心性;
步驟4:取網絡節點的度中心性,接近中心性,中介中心性和特征向量中心性的前N個數據作為為篩選出的相關基因。
2.根據權利要求1所述一種基于乳腺癌疾病的基因調控網絡構建及分析方法,其特征在于,所述網絡節點的度中心性,接近中心性,中介中心性和特征向量中心性的前N個數據,N≤10,且矩陣X中的基因數量MN。
3.根據權利要求1所述一種基于乳腺癌疾病的基因調控網絡構建及分析方法,其特征在于,所述步驟1.3中人工選擇閾值Isn,其中sn等于需要篩選出來的基因數量除以需要的輪數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東北大學,未經東北大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201810972336.2/1.html,轉載請聲明來源鉆瓜專利網。





