[發明專利]基于反饋式條件隨機場的G蛋白偶聯受體拓撲計算預測方法有效
| 申請號: | 201510155276.1 | 申請日: | 2015-04-02 |
| 公開(公告)號: | CN104732117B | 公開(公告)日: | 2018-02-13 |
| 發明(設計)人: | 陳石敏;吳宏杰;陸衛忠;王坤;胡伏原;付保川 | 申請(專利權)人: | 蘇州科技學院 |
| 主分類號: | G06F19/18 | 分類號: | G06F19/18 |
| 代理公司: | 蘇州慧通知識產權代理事務所(普通合伙)32239 | 代理人: | 安紀平 |
| 地址: | 215009 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 反饋 條件 隨機 蛋白 受體 拓撲 計算 預測 方法 | ||
1.一種基于反饋式條件隨機場的G蛋白偶聯受體拓撲計算預測方法,其特征在于,該預測方法包括:
(1)數據集準備:準備TMPDB_FB和PDBTM_FB兩個數據集,所述TMPDB_FB包含從TMPDB中選取的106條不同的α螺旋鏈,所述PDBTM_FB包含從PDBTM中選取的472條非冗余的α螺旋鏈;
(2)數據預處理:對所述數據集進行歸一化,把殘基的物理屬性值和輪廓特征屬性值的值域映射到[0,1]區間;
(3)反饋式條件隨機場,包括三個階段:
(31)基本條件隨機場模型:條件隨機場理論,標記序列Y和給定觀察序列X之間的條件概率分布如式(1)所示:
其中,tj(yi-1,yi,x,i)是一個關于整個觀察序列和標記序列中在i和i-1位置上的標記的轉換特征函數,sj(yi,x,i)是一個關于在i位置上的標記和整個觀察序列的狀態特征函數,tj和sj中的j是特征序數,以表示不同的特征值,參數λj和μj于特征tj和sj相對應,是通過學習得到的,Z(X)是歸一化因子,它保證了式(1)中所有分布值的和為1;
(32)反饋式條件隨機場框架:在反饋式條件隨機場中,將低層模型的預測結果反饋給高層模型,高層模型將從低層模型中提取的反饋特征作為自己模型特征的一部分,來構建新的模型;
(33)反饋機制與算法:反饋特征的計算用公式2表示,Ti,j=P(M|Uk,j),Fi,j∈Uk,j(2),即Fi,j所對應的反饋特征Ti,j等于在區間Uk,j條件下低層模型的預測標記為殘基跨膜M的概率,其中Fi,j∈Uk,j,Uk,j中的j用于標識所在的列;得到反饋特征后,將其添加到歸一化后的文件中,特征值Ti,j所在的行為i,列是j,將特征值與非反饋特征值Fi,j按照樣本進行合并,再進行分割,生成了高層模型的訓練集和測試集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州科技學院,未經蘇州科技學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201510155276.1/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





