[發(fā)明專利]一種通過(guò)相似度進(jìn)行菌株溯源及屬性鑒定的方法有效
| 申請(qǐng)?zhí)枺?/td> | 202210991537.3 | 申請(qǐng)日: | 2022-08-18 |
| 公開(kāi)(公告)號(hào): | CN115064215B | 公開(kāi)(公告)日: | 2023-10-24 |
| 發(fā)明(設(shè)計(jì))人: | 王輝;王舒意;孫世俊;郭一凡;王啟;李振中 | 申請(qǐng)(專利權(quán))人: | 北京大學(xué)人民醫(yī)院 |
| 主分類號(hào): | G16B30/10 | 分類號(hào): | G16B30/10;G16B20/30;G16B40/00;G16B50/00;G06F18/23;G06F18/22 |
| 代理公司: | 北京領(lǐng)創(chuàng)律師事務(wù)所 11778 | 代理人: | 沈斌;習(xí)文峰 |
| 地址: | 100044 北*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 通過(guò) 相似 進(jìn)行 菌株 溯源 屬性 鑒定 方法 | ||
本發(fā)明提供一種通過(guò)相似度進(jìn)行菌株溯源及屬性鑒定的方法,其包含如下步驟:a)將樣本中菌株的測(cè)序序列或組裝序列和聚類泛基因組數(shù)據(jù)庫(kù)中每個(gè)簇的泛基因組進(jìn)行序列比對(duì);b)根據(jù)比對(duì)上序列的覆蓋度篩選比對(duì)結(jié)果;c)根據(jù)篩選的比對(duì)結(jié)果計(jì)算簇相似度,選取簇相似度最大的L個(gè)簇作為候選簇;d)從每個(gè)所述候選簇中選取株相似度最大的M個(gè)原始菌株作為候選菌株;e)從所述候選菌株中,選取株相似度最大的N個(gè)原始菌株,作為來(lái)源菌株;f)根據(jù)所述來(lái)源菌株獲取所述樣本中菌株的來(lái)源信息及屬性信息。采用此方法可快速、準(zhǔn)確地鑒定出病原微生物的屬性和來(lái)源。
技術(shù)領(lǐng)域
本發(fā)明屬于生信分析領(lǐng)域,具體涉及一種通過(guò)相似度進(jìn)行菌株溯源及屬性鑒定的方法。
背景技術(shù)
傳統(tǒng)藥敏檢測(cè)方法如紙片擴(kuò)散法和肉湯稀釋法,耗時(shí)長(zhǎng),且需要先將細(xì)菌分離培養(yǎng)為純培養(yǎng)物。傳統(tǒng)的溯源或同源性分析往往依賴于從頭開(kāi)始的系統(tǒng)發(fā)育分析,每得到一株新純培養(yǎng)物,對(duì)菌株序列進(jìn)行一次新的系統(tǒng)發(fā)育分析,觀察該序列在系統(tǒng)發(fā)育樹(shù)上的位置。此類方法由于需要如細(xì)菌的分離培養(yǎng)、基因組提取、基因組組裝、基因功能注釋、核心基因組分析、系統(tǒng)發(fā)育樹(shù)分析等步驟,所需時(shí)間長(zhǎng),且比對(duì)結(jié)果嚴(yán)重依賴于各實(shí)驗(yàn)室或醫(yī)院納入的菌株范圍。
宏基因組學(xué)規(guī)避了對(duì)樣本的微生物的分離培養(yǎng),可進(jìn)行樣本直接檢測(cè),報(bào)告所有檢出序列的病原體,其檢測(cè)速度之快為危急感染患者的臨床診斷提供新保障。雖然能通過(guò)宏基因組能得到所有檢出序列的病原體,但是無(wú)法得知該病原體的來(lái)源,基因組屬性等。這可能會(huì)錯(cuò)過(guò)院內(nèi)暴發(fā)或者社區(qū)暴發(fā),導(dǎo)致更多感染性事件的發(fā)生。無(wú)法得知基因組屬性還可能導(dǎo)致用藥錯(cuò)誤或藥物濫用。
有鑒于此,提出本發(fā)明。
發(fā)明內(nèi)容
本發(fā)明提供一種通過(guò)聚類泛基因組和相似度快速鑒定菌株屬性及其來(lái)源的方法,采用此方法可快速、準(zhǔn)確地鑒定出病原微生物的屬性和來(lái)源,具體包括以下實(shí)施方式:
實(shí)施方式1. 一種通過(guò)相似度進(jìn)行菌株溯源及屬性鑒定的方法,其特征在于,包含如下步驟:
a)序列比對(duì):將樣本中菌株的測(cè)序序列或組裝序列和聚類泛基因組數(shù)據(jù)庫(kù)中每個(gè)簇的泛基因組進(jìn)行序列比對(duì),其中所述聚類泛基因組數(shù)據(jù)庫(kù)中包含泛基因組序列-原始序列-原始菌株關(guān)聯(lián)關(guān)系,和任選的屬性信息;
b)比對(duì)結(jié)果篩選:對(duì)a)得到的序列比對(duì)結(jié)果,根據(jù)比對(duì)上序列的覆蓋度篩選比對(duì)結(jié)果;
c)計(jì)算相似度,篩選候選簇:根據(jù)b)篩選的比對(duì)結(jié)果計(jì)算樣本中菌株與某簇的簇相似度,選取簇相似度最大的L個(gè)簇作為樣本中菌株所在的候選簇,其中,L為正整數(shù);
d)篩選候選菌株:從每個(gè)所述候選簇中選取株相似度最大的M個(gè)原始菌株作為與樣本中菌株相似的候選菌株,其中,M為正整數(shù),所述株相似度用以衡量樣本中菌株與所述聚類泛基因組數(shù)據(jù)庫(kù)中關(guān)聯(lián)的原始菌株的相似性;
e)確定來(lái)源菌株:從所述候選菌株中,選取株相似度最大的N個(gè)原始菌株,作為樣本中菌株的來(lái)源菌株,其中,N為正整數(shù);
f)獲取來(lái)源信息及屬性信息:根據(jù)所述來(lái)源菌株獲取所述樣本中菌株的來(lái)源信息及屬性信息。
實(shí)施方式2. 根據(jù)實(shí)施方式1所述的方法,其特征在于,所述覆蓋度為某條測(cè)序序列或組裝序列與該簇泛基因組某條序列比對(duì)上的長(zhǎng)度占所述該簇泛基因組某條序列的長(zhǎng)度的百分比。
實(shí)施方式3. 根據(jù)實(shí)施方式1所述的方法,其特征在于,所述覆蓋度為某條測(cè)序序列或組裝序列與該簇泛基因組某條序列比對(duì)上的長(zhǎng)度占所述某條測(cè)序序列或組裝序列的長(zhǎng)度的百分比。
實(shí)施方式4. 根據(jù)實(shí)施方式1所述的方法,其特征在于,所述簇相似度為比對(duì)上某簇泛基因組所有序列的相似度的平均值。
實(shí)施方式5. 根據(jù)實(shí)施方式1所述的方法,其特征在于,所述篩選候選簇如下進(jìn)行:
所述L選取5個(gè)至10個(gè),或者
選取簇相似度達(dá)到最大簇相似度的99%的簇作為樣本中菌株所在的候選簇。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京大學(xué)人民醫(yī)院,未經(jīng)北京大學(xué)人民醫(yī)院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/202210991537.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 相似圖像提取裝置、相似圖像提取方法以及相似圖像提取程序
- 一種鋼結(jié)構(gòu)火災(zāi)反應(yīng)分析方法
- 相似度計(jì)算裝置、相似度計(jì)算方法以及相似度計(jì)算程序
- 一種蛋白質(zhì)相似度及相似蛋白質(zhì)的確定方法和系統(tǒng)
- 一種獲取相似語(yǔ)句的方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種圖像搜索方法、裝置和存儲(chǔ)介質(zhì)
- 基于相似壽命模型和相似壽命的復(fù)雜產(chǎn)品可靠性評(píng)定方法
- 獲取機(jī)構(gòu)技術(shù)相似性的方法及裝置
- 口罩(相似)
- 臺(tái)燈(相似)
- 請(qǐng)求沒(méi)有進(jìn)行IMS注冊(cè)的用戶進(jìn)行注冊(cè)的方法
- 對(duì)要進(jìn)行紋理操作的像素進(jìn)行分組
- 對(duì)餐盤進(jìn)行溫度調(diào)節(jié)和進(jìn)行分配的獨(dú)立小車
- 對(duì)圖像進(jìn)行編碼
- 對(duì)任務(wù)進(jìn)行調(diào)度
- 對(duì)任務(wù)進(jìn)行調(diào)度
- 蛋糕(甜蜜進(jìn)行時(shí))
- 對(duì)定位輔助數(shù)據(jù)進(jìn)行分級(jí)和分組以進(jìn)行廣播
- 對(duì)物體進(jìn)行分離和定向以進(jìn)行供料
- 對(duì)工件進(jìn)行評(píng)價(jià)以進(jìn)行加工的方法





