[發(fā)明專利]基于眾核協(xié)處理器的三級(jí)流水序列比對(duì)方法有效
| 申請(qǐng)?zhí)枺?/td> | 201410745667.4 | 申請(qǐng)日: | 2014-12-09 |
| 公開(公告)號(hào): | CN104375807A | 公開(公告)日: | 2015-02-25 |
| 發(fā)明(設(shè)計(jì))人: | 廖湘科;朱小謙;崔英博;彭紹亮;鄒丹;王恒;朱敏;劉欣;王海強(qiáng);高明 | 申請(qǐng)(專利權(quán))人: | 中國人民解放軍國防科學(xué)技術(shù)大學(xué) |
| 主分類號(hào): | G06F9/38 | 分類號(hào): | G06F9/38 |
| 代理公司: | 國防科技大學(xué)專利服務(wù)中心 43202 | 代理人: | 郭敏 |
| 地址: | 410073 湖*** | 國省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 眾核協(xié) 處理器 三級(jí) 流水 序列 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及生物信息領(lǐng)域序列比對(duì)的方法,尤其指一種基于眾核協(xié)處理器的序列比對(duì)方法。
背景技術(shù)
分子生物學(xué)是從分子水平上研究生命現(xiàn)象物質(zhì)基礎(chǔ)的學(xué)科,通過研究生物分子的結(jié)構(gòu)、功能和合成等方面的原理,從而使生物體的功能和性狀在前所未有的分子細(xì)節(jié)上得到詳盡的分析和理解,進(jìn)而更加科學(xué)嚴(yán)謹(jǐn)?shù)仃U明生命現(xiàn)象的本質(zhì)。
在分子生物學(xué)研究中,DNA的序列分析是進(jìn)一步研究和改造目的基因的基礎(chǔ)。DNA(脫氧核糖核酸)是一種生物大分子,一共分為四種堿基,記為A、T、C、G,這些大分子的排列順序決定了某種遺傳指令,這些遺傳指令是建構(gòu)細(xì)胞內(nèi)其他的化合物,如蛋白質(zhì)與核糖核酸的需要。帶有蛋白質(zhì)編碼的DNA片段稱為基因,即遺傳物質(zhì),是DNA分子上具有遺傳信息的特定核苷酸序列。基因經(jīng)過轉(zhuǎn)錄、翻譯,最終產(chǎn)生結(jié)構(gòu)和功能各異的、表現(xiàn)生物體性狀的蛋白質(zhì)。
DNA序列分析的基礎(chǔ)是對(duì)DNA分子進(jìn)行測(cè)序,即確定DNA分子中A、T、C、G四種堿基的排列順序。當(dāng)前的DNA測(cè)序技術(shù),一次實(shí)驗(yàn)最多只能直接測(cè)得不大于5000個(gè)堿基的排列順序,形成多個(gè)DNA短序列(稱為read)。而一般生物的基因組堿基數(shù)目都十分巨大,如人類基因組總長約為30億個(gè)堿基對(duì)。這樣,絕大多數(shù)生物的基因組都不能通過實(shí)驗(yàn)手段一次性獲得,而必須借助于計(jì)算機(jī)技術(shù)進(jìn)行后續(xù)拼接得到完整的基因組。
序列比對(duì)是目前廣泛使用的DNA序列分析方法,它是將測(cè)序得到的read短序列直接與拼接完成的參考基因組進(jìn)行比對(duì),確定read在參考基因組中是否出現(xiàn)以及出現(xiàn)的具體位置。通過序列比對(duì)進(jìn)行DNA序列分析,避免了對(duì)目標(biāo)基因組進(jìn)行組裝,可以很大程度上節(jié)省序列分析的時(shí)間和工作量,提高序列分析的效率。
由于比對(duì)時(shí)read數(shù)量都較大,無法一次性全部存放到計(jì)算機(jī)主存中。所以目前常用的DNA序列比對(duì)方法均按照以下步驟進(jìn)行:
步驟1:根據(jù)計(jì)算機(jī)主存可用空間大小,將read平均分為若干組,每一組所占空間大小不超過計(jì)算機(jī)主存容量;
步驟2:從磁盤上讀取一組read到主存中;
步驟3:對(duì)讀取到主存中的read逐個(gè)進(jìn)行比對(duì);
步驟4:將read比對(duì)結(jié)果寫回磁盤;
步驟5:檢查磁盤中是否還存在未比對(duì)的序列,如果存在,返回步驟2;如果不存在,結(jié)束比對(duì)過程。
目前比對(duì)主要使用的運(yùn)算器件為計(jì)算機(jī)中央處理器CPU或者圖形處理器GPU。
雖然與進(jìn)行序列組裝相比,序列比對(duì)可以節(jié)省大量時(shí)間,但是目前廣泛使用的基于CPU的串行序列比對(duì)方法的速度仍比較慢,如在配備兩路八核Intel?2.4GHz?CPU的常用服務(wù)器上,采用李恒在論文《Fast?and?accurate?short?read?alignment?with?Burrows-Wheeler?Transform》中公布的基于BW(Burrows-Wheeler)變換的序列比對(duì)方法,對(duì)長度為100個(gè)堿基的8千萬條序列進(jìn)行比對(duì),需要花費(fèi)一天以上時(shí)間,很難滿足后序的序列分析對(duì)于時(shí)間的要求,更是無法滿足時(shí)效性要求較高的臨床需求。
基于CPU的并行序列比對(duì)方法使得多個(gè)線程能夠并行進(jìn)行序列比對(duì),有效地提高了序列比對(duì)的速度。但是目前絕大部分研究機(jī)構(gòu)使用的是單節(jié)點(diǎn)服務(wù)器,CPU計(jì)算能力十分有限。而隨著測(cè)序技術(shù)的發(fā)展,特別是新一代高通量測(cè)序技術(shù)的出現(xiàn),單位時(shí)間內(nèi)產(chǎn)生的read數(shù)量翻了幾翻,基于CPU的并行序列比對(duì)軟件也已經(jīng)很難有效處理如此大量的read。
基于GPU的序列比對(duì)軟件,利用GPU具有大量計(jì)算核心的特性,使用其對(duì)序列比對(duì)進(jìn)行加速,有效地增強(qiáng)了服務(wù)器的計(jì)算能力,與基于CPU的并行序列比對(duì)方法相比,進(jìn)一步提高了速度。GPU指令集設(shè)計(jì)與CPU相比較為簡單,但是能夠快速處理簡單的浮點(diǎn)和整型計(jì)算。而目前廣泛使用的李恒在論文《Fast?and?accurate?short?read?alignment?with?Burrows-Wheeler?Transform》中公布的基于BW(Burrows-Wheeler)變換的序列比對(duì)方法運(yùn)算過程復(fù)雜,程序分支多,當(dāng)GPU中的一個(gè)核心遇到分支時(shí),與其同組的其他核心均要等待該分支處理完畢才能繼續(xù)并行執(zhí)行,很大程度上降低了序列比對(duì)的效率。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國人民解放軍國防科學(xué)技術(shù)大學(xué),未經(jīng)中國人民解放軍國防科學(xué)技術(shù)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201410745667.4/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種基于倒向隨機(jī)微分方程的期權(quán)定價(jià)方法
- 一種用于眾核處理器的函數(shù)處理方法及系統(tǒng)
- 優(yōu)化眾核系統(tǒng)修復(fù)性能的運(yùn)算流圖映射方法及裝置
- 一種基于格子Boltzmann理論CPU/MIC協(xié)同計(jì)算的大渦模擬方法
- 基于眾核協(xié)處理器的三級(jí)流水序列比對(duì)方法
- 一種類腦計(jì)算芯片及計(jì)算設(shè)備
- 一種代碼生成方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- 基于RMA的眾核分布式共享SPM實(shí)現(xiàn)方法
- 一種內(nèi)嵌FPGA的眾核架構(gòu)及其數(shù)據(jù)處理方法
- 一種具有異構(gòu)處理器的眾核架構(gòu)及其數(shù)據(jù)處理方法
- 用于六級(jí)變速器的三級(jí)軸機(jī)構(gòu)
- 一種用于發(fā)電機(jī)自動(dòng)電壓調(diào)節(jié)器電路的功率開關(guān)電路
- 帶三級(jí)齒輪軸機(jī)構(gòu)的聯(lián)合減速箱
- 帶三級(jí)行星輪機(jī)構(gòu)的行星齒輪減速器
- 帶三級(jí)太陽輪機(jī)構(gòu)的行星齒輪減速器
- 循環(huán)水泵流體增壓裝置
- 一種三級(jí)升降立柱機(jī)構(gòu)
- 一種超臨界加熱式縱向三級(jí)朗肯循環(huán)發(fā)電系統(tǒng)
- 面坯加工輸送生產(chǎn)線的三級(jí)壓面裝置
- 一種FSRU上超臨界三級(jí)級(jí)聯(lián)朗肯循環(huán)發(fā)電系統(tǒng)





