[發明專利]一種基于兩階段差分進化算法的蛋白質結構預測方法在審
| 申請號: | 201610139379.3 | 申請日: | 2016-03-11 |
| 公開(公告)號: | CN105760710A | 公開(公告)日: | 2016-07-13 |
| 發明(設計)人: | 張貴軍;俞旭鋒;周曉根;郝小虎;王柳靜;李章維 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G06F19/16 | 分類號: | G06F19/16 |
| 代理公司: | 杭州斯可睿專利事務所有限公司 33241 | 代理人: | 王利強 |
| 地址: | 310014 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 階段 進化 算法 蛋白質 結構 預測 方法 | ||
技術領域
本發明涉及生物信息學、計算機應用領域,尤其涉及的是一種基于兩階段差分進化算法的蛋白質結構預測方法。
背景技術
蛋白質分子在生物細胞化學反應過程中起著至關重要的作用。它們的結構模型和生物活性狀態對我們理解和治愈多種疾病有重要的意義。蛋白質只有折疊成特定的三維結構才能產生其特有的生物學功能。因此,要了解蛋白質的功能,就必須獲得其三維空間結構。
生物信息學是生命科學和計算機科學交叉領域的一個研究熱點。生物信息學研究成果目前已經被廣泛應用于基因發現和預測、基因數據的存儲管理、數據檢索與挖掘、基因表達數據分析、蛋白質結構預測、基因和蛋白質同源關系預測、序列分析與比對等。目前,根據Anfinsen假設,直接從氨基酸序列出發,基于勢能模型,采用全局優化方法,搜索分子系統的最小能量狀態,從而高通量、廉價地預測肽鏈的天然構象,已經成為生物信息學最重要的研究課題之一。對于序列相似度低或多肽(<10個殘基的小蛋白)來說,從頭預測方法是唯一的選擇。從頭預測方法必須考慮以下兩個因素:(1)蛋白質結構能量函數;(2)構象空間搜索方法。第一個因素本質上屬于分子力學問題,主要是為了能夠計算得到每個蛋白質結構對應的能量值。目前已經存在一些有效的結構能量函數,如簡單網格模型HP及更實際的經驗力場模型MM3,AMBER,CHARMM,GROMOS,DISCOVER,ECEPP/3等;第二個因素本質上屬于全局優化問題,通過選擇一種合適的優化方法,對構象空間進行快速搜索,得到與某一全局最小能量對應的構象。其中,蛋白質構象空間優化屬于一類非常難解的NP-Hard問題。2005年,D.Baker在Science中指出,構象空間優化方法是制約蛋白質從頭預測方法預測精度的一個瓶頸因素。
因此,現有的蛋白質結構預測方法存在采樣效率、復雜度及預測精度方面存在不足,需要改進。
發明內容
為了克服現有蛋白質結構預測存在采樣效率低、復雜度較高及預測精度較低的不足,本發明提出一種預測精度較高、復雜度較低的基于兩階段差分進化算法的蛋白質結構預測方法。
本發明解決其技術問題所采用的技術方案是:
一種基于兩階段差分進化算法的蛋白質結構預測方法,所述預測方法包括以下步驟:
1)給定查詢序列信息;
2)初始化:設置群體規模NP,變異因子F,交叉概率CR,迭代次數iteration,片段長度為L,能量函數選用RosettaScore3,首先通過對查詢序列隨機的折疊和變換,生成一個規模為NP的初始種群,初始群體為P={xi|i∈I},計算初始種群個體的能量值f(xi),i∈I,其中i為種群個體編號,I為種群個體編號集合,I={1,2,...,NP};
3)開始迭代,令g=1,g為迭代計數器,依次對種群中每個個體進行以下操作:
3.1)如果g<iteration/2,則執行如下操作:
隨機選取種群中的一個構象個體Pi,i∈{1,2,3,…,NP},令Ptarget=Pi,Ptarget表示目標構象個體,跳轉至3.3),執行以下操作得到變異構象Pmutant;
3.2)如果iteration/2<g<iteration,則執行如下操作:
根據能量對整個種群中的構象進行降序排列,然后從能量低的前50%的NP個構象個體中隨機選出一個構象記為Ppbest,令Ptarget=Ppbest,Ptarget表示目標構象個體,執行以下操作得到變異構象Pmutant;
3.3)隨機生成正整數rand1,rand2,rand3∈{1,2,3,......NP},且rand1≠rand2≠rand3≠i;再生成4個隨機整數randrange1,randrange2,randrange3,randrange4;其中randrange1≠randrange2,randrange3≠randrange4∈{1,2,…,Length},Length為序列長度;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201610139379.3/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建?;蚍抡?,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





