[發明專利]基于知識圖譜的圖卷積藥物對相互作用預測方法及系統在審
| 申請號: | 202010216234.5 | 申請日: | 2020-03-25 |
| 公開(公告)號: | CN111564186A | 公開(公告)日: | 2020-08-21 |
| 發明(設計)人: | 全哲;林軒;王志杰;馬騰飛;曾湘詳 | 申請(專利權)人: | 湖南大學 |
| 主分類號: | G16C20/30 | 分類號: | G16C20/30;G16C20/50;G16C20/70 |
| 代理公司: | 深圳市興科達知識產權代理有限公司 44260 | 代理人: | 王翀;陽江軍 |
| 地址: | 410082 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 知識 圖譜 圖卷 藥物 相互作用 預測 方法 系統 | ||
本發明提供一種基于知識圖譜的圖卷積藥物對相互作用預測方法,包括:提取藥物對數據樣本,生成含訓練集、驗證集和測試集的數據集;構建數據集對應的知識圖譜;建立GCN藥物對相互作用預測模型,學習藥物對中所含藥物及其鄰域的特征信息;將訓練集的藥物對數據樣本輸入到GCN藥物對相互作用預測模型,訓練GCN藥物對相互作用預測模型;將訓練結果優化損失函數后送入GCN藥物對相互作用預測模型訓練;經過迭代計算,完成GCN藥物對相互作用預測模型的訓練;將測試集中的藥物對數據樣本輸入到GCN藥物對相互作用預測模型得到測試結果;對所述測試結果進行分析得到預測結果。本發明提供的基于知識圖譜的圖卷積藥物對相互作用預測方法及系統準確性高、訓練耗時短。
【技術領域】
本發明涉及藥物對相互作用預測技術領域,尤其涉及一種基于知識圖譜的圖卷積藥物對相互作用預測方法及系統。
【背景技術】
藥物研發是高投入、高風險的領域,一款藥物從研發到上市售賣平均需要花費10-15年、平均投入26億美元左右,而且平均每5000-10000個進入研發管線的分子中只有一個能夠研發成功。采用計算的方法能夠很大程度上降低成本,依靠數據驅動的機器學習方法,通過大量開源的實驗數據訓練模型并進行下游任務的預測,已成為藥物發現領域中作為輔助計算的熱點。
相關技術中,機器學習算法被廣泛用于藥物與藥物相互作用的預測。大多數已存在的人工智能計算模型通常需要整合多源數據集的藥物信息,如藥物本身的各類信息(結構、性質等),部分方法聚焦于對藥物特征的表示學習,通過SMILES分子來獲取藥物的結構特征,通過結構相似性來預測藥物間的相互作用;或者整合藥物副作用及其他相關聯系,一些方法通過構建各類關系網絡,并結合有效的圖嵌入方法來預測藥物與藥物相互作用。這些方法由于數據集可獲取的多類標簽數據稀少,難以獲得分布合理的數據樣本用于批量訓練。同時當前的主流方法均只考慮到藥物間的單一關系即藥物與藥物相互作用,忽略藥物與其他實體(例如靶標和基因)之間存在的潛在關聯。
知識圖譜由于其蘊含豐富的實體和關聯信息,為探索藥物與其他實體存在潛在關聯提供一種可能。同時,得益于圖神經網絡在眾多領域中展現的顯著效果,它能夠通過迭代地提取所構圖中的鄰域信息,設計有效的聚合方法有效地表示圖中節點特征和鄰域信息,更能捕捉知識圖譜中潛在的實體間聯系。
因此,有必要提供一種基于知識圖譜的圖卷積藥物對相互作用預測方法及系統來解決上述問題。
【發明內容】
本發明針對上述要解決的技術問題,提供一種準確度高、訓練耗時短的基于知識圖譜的圖卷積藥物對相互作用預測方法及系統。
本發明提供一種基于知識圖譜的圖卷積藥物對相互作用預測方法,包括如下步驟:
S1:提取藥物對數據樣本,生成數據集,所述數據集包括訓練集、驗證集和測試集;
S2:構建所述數據集對應的知識圖譜;
S3:建立GCN藥物對相互作用預測模型,利用所述知識圖譜學習所述藥物對中所含藥物及其鄰域的特征信息;
S4:將所述訓練集中的藥物對數據樣本輸入到所述GCN藥物對相互作用預測模型,對所述GCN藥物對相互作用預測模型進行訓練;
S5:將所述GCN藥物對相互作用預測模型的訓練結果優化損失函數后重新送入所述GCN藥物對相互作用預測模型進行訓練;
S6:經過多次迭代計算,完成所述GCN藥物對相互作用預測模型的訓練;
S7:將所述測試集中的藥物對數據樣本輸入到所述GCN藥物對相互作用預測模型中,得到測試結果;
S8:對所述測試結果進行分析,得到藥物對相互作用的預測結果。
優選的,所述數據集中所述訓練集的占比為80%,所述驗證集的占比為10%,所述測試集的占比為10%。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖南大學,未經湖南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202010216234.5/2.html,轉載請聲明來源鉆瓜專利網。





