[發(fā)明專利]考慮重復(fù)性的堿基序列重組系統(tǒng)及方法在審
| 申請?zhí)枺?/td> | 201310373186.0 | 申請日: | 2013-08-23 |
| 公開(公告)號: | CN103793624A | 公開(公告)日: | 2014-05-14 |
| 發(fā)明(設(shè)計(jì))人: | 樸旻胥 | 申請(專利權(quán))人: | 三星SDS株式會社 |
| 主分類號: | G06F19/18 | 分類號: | G06F19/18 |
| 代理公司: | 北京銘碩知識產(chǎn)權(quán)代理有限公司 11286 | 代理人: | 金光軍;韓芳 |
| 地址: | 韓國*** | 國省代碼: | 韓國;KR |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 考慮 重復(fù)性 堿基 序列 重組 系統(tǒng) 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明的實(shí)施例涉及一種用于分析基因組的堿基序列的技術(shù)。
背景技術(shù)
用于生產(chǎn)高容量短序列的第二代測序方式(NGS:Next?Generation?Sequencing)因其低廉的成本和迅速生成數(shù)據(jù)的能力而正在迅速地替代傳統(tǒng)的桑格(Sanger)測序方式。并且,開發(fā)出了多種聚焦于準(zhǔn)確度的NGS序列重組程序。然而,近來隨著第二代測序技術(shù)的發(fā)展,制作片段序列的費(fèi)用降低為過去的一半以下,隨之可用數(shù)據(jù)的量增加,因此需要開發(fā)一種能夠在短時間內(nèi)準(zhǔn)確地處理高容量短序列的技術(shù)。
序列重組的第一個步驟為通過堿基序列比對(alignment)算法而將短片段(read)映射(mapping)于參考序列的正確位置上。其中的問題在于即使是同種個體,也可能因多種遺傳性變異而導(dǎo)致基因組序列上的差異。而且,測序過程中的誤差也可能導(dǎo)致堿基序列上的差異。因此,堿基序列重組算法必須有效考慮這種差異和變異而提高映射準(zhǔn)確度。
總而言之,為了對基因組信息進(jìn)行分析,需要盡量多而準(zhǔn)確的所有基因組信息數(shù)據(jù)。而且,為了達(dá)到這一目的,首先是要開發(fā)出具有很高的準(zhǔn)確度和較大處理量的堿基序列重組算法。然而,現(xiàn)有技術(shù)中的方法在滿足這些需求條件方面存在局限性。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例的目的在于提供一種可在確保映射準(zhǔn)確度的同時通過改善映射時的復(fù)雜度而提高處理速度的堿基序列重組方案。
根據(jù)本發(fā)明一個實(shí)施例的堿基序列重組系統(tǒng)包括:片段序列生成單元,用于由短片段生成多個片段(fragment)序列;片段序列長度調(diào)整單元,從生成的所述多個片段序列當(dāng)中選擇對象堿基序列上的映射重復(fù)數(shù)超過設(shè)定基準(zhǔn)值的片段序列,并調(diào)整選擇的片段序列的長度,直到所述選擇的片段序列的映射重復(fù)數(shù)達(dá)到所述基準(zhǔn)值以下;比對單元,利用所述片段序列執(zhí)行全局比對(Global?alignment)。
另外,根據(jù)本發(fā)明另一實(shí)施例的堿基序列重組系統(tǒng)包括:片段序列生成單元,用于由短片段生成多個片段(fragment)序列;篩選單元,用于從生成的所述多個片段序列中除去對象堿基序列上的映射重復(fù)數(shù)超過設(shè)定上限值的片段序列;比對單元,利用除了被除去的所述片段序列以外的其余片段序列而執(zhí)行全局比對(Global?alignment)。
另外,根據(jù)本發(fā)明一個實(shí)施例的堿基序列重組方法包括如下步驟:在片段序列生成單元中,由短片段生成多個片段(fragment)序列;在片段序列長度調(diào)整單元中,從生成的所述多個片段序列當(dāng)中選擇對象堿基序列上的映射重復(fù)數(shù)超過設(shè)定基準(zhǔn)值的片段序列,并調(diào)整選擇的片段序列的長度,直到所述選擇的片段序列的映射重復(fù)數(shù)達(dá)到所述基準(zhǔn)值以下;在比對單元中,利用所述片段序列執(zhí)行全局比對(Global?alignment)。
另外,根據(jù)本發(fā)明另一實(shí)施例的堿基序列重組方法包括如下步驟:在片段序列生成單元中,由短片段生成多個片段(fragment)序列;在篩選單元中,從生成的所述多個片段序列中除去對象堿基序列上的映射重復(fù)數(shù)超過設(shè)定上限值的片段序列;在比對單元中,利用除了被除去的所述片段序列以外的其余片段序列而執(zhí)行全局比對(Global?alignment)。
根據(jù)本發(fā)明的實(shí)施例,并不固定由短片段生成的片段序列的長度,而是根據(jù)各片段序列在對象堿基序列內(nèi)的映射重復(fù)數(shù)而適當(dāng)?shù)財(cái)U(kuò)增其長度,或者除去重復(fù)數(shù)過多的片段序列,從而具有可以提高映射準(zhǔn)確度的同時也能提高速度的效果。
附圖說明
圖1為用于說明根據(jù)本發(fā)明一個實(shí)施例的堿基序列重組方法的圖。
圖2為用于舉例表示根據(jù)本發(fā)明一個實(shí)施例的堿基序列重組方法中的最小誤差估計(jì)值(MEB)e計(jì)算過程的圖。
圖3為用于說明根據(jù)本發(fā)明一個實(shí)施例的堿基序列重組方法中的片段序列提取過程示例的圖。
圖4為根據(jù)本發(fā)明一個實(shí)施例的堿基序列重組系統(tǒng)400的模塊圖。
圖5為根據(jù)本發(fā)明另一實(shí)施例的堿基序列重組系統(tǒng)500的模塊圖。
符號說明:
400、500:堿基序列重組系統(tǒng)????402、502:片段序列生成單元
404:片段序列長度調(diào)整單元?????406、506:比對單元
408、504:篩選單元
具體實(shí)施方式
以下,參照附圖說明本發(fā)明的具體實(shí)施方式。然而這僅僅是示例,本發(fā)明并不局限于此。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于三星SDS株式會社,未經(jīng)三星SDS株式會社許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201310373186.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計(jì)算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計(jì)算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建模或仿真,例如:概率模型或動態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)洌媒Y(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 標(biāo)志控制請求代理仲裁的方法和系統(tǒng)
- 信號處理方法與設(shè)備以及記錄介質(zhì)
- 一種考慮能量傳輸?shù)闹欣^選擇方法
- 一種考慮電網(wǎng)分區(qū)優(yōu)化運(yùn)行的城市電網(wǎng)規(guī)劃方法
- 一種定位考慮攻擊精度的骨干鏈路DDoS攻擊目標(biāo)鏈路的方法
- 基于全局策略管理節(jié)點(diǎn)網(wǎng)絡(luò)故障的程序
- 基于本地策略管理節(jié)點(diǎn)網(wǎng)絡(luò)故障的程序
- 考慮互補(bǔ)約束的潮流計(jì)算方法及裝置
- 考慮穩(wěn)態(tài)約束和暫態(tài)約束的聯(lián)絡(luò)線功率可行域刻畫方法
- 土結(jié)作用的變壓器本體地震放大系數(shù)確定及抗震評估方法





