91香蕉国产观看免费_自拍亚洲欧美日韩另类图区_免费av大片黄在线观看_免费观看黄页网站精品_成人国产精品免费_日韩欧美制服丝袜综合_欧美日韩中文字幕在线手机版本_亚洲第一成人福利网站_嫩草视频研究操女_亚洲熟妇无码av另类vr影视

新軟件彌補三代基因測序“硬傷”

時間:2016-07-05     來源:中國生物技術(shù)信息網(wǎng)
中國科學(xué)院昆明動物研究所“計算生物與醫(yī)學(xué)生態(tài)學(xué)科組”研究員馬占山與美國馬里蘭大學(xué)博士葉承曦在基因測序領(lǐng)域的合作取得新的突破。針對第三代基因測序儀硬件錯誤率高達(dá)15%~40%的現(xiàn)實,該團隊研發(fā)出了一套“線性復(fù)雜度”的算法,這套算法復(fù)雜性最低,基于該新算法完成了Sparc軟件的開發(fā)。

    Sparc軟件能夠有效彌補三代測序技術(shù)硬件超高錯誤率這一“硬傷”,大幅度提高三代技術(shù)的市場競爭能力,為迎接基因測序產(chǎn)業(yè)升級奠定優(yōu)良的技術(shù)基礎(chǔ)。

    另外,Sparc 算法應(yīng)用范圍不止于基因組裝技術(shù);事實上,基因組學(xué)中諸多涉及糾錯和變異檢測的技術(shù)都可受益于Sparc算法的線性復(fù)雜度優(yōu)勢。

    Sparc是馬占山2011年回國后該團隊在基因測序領(lǐng)域所研發(fā)公布的第三款重要軟件。“過去五年來我們與馬里蘭大學(xué)團隊合作,總共在基因測序領(lǐng)域研發(fā)公布了三款軟件,SparseAssembler、DBG2OLC以及最新的 Sparc。”

    其中,第一款是為二代測序技術(shù)設(shè)計,后兩款為最新的三代技術(shù)所研發(fā)。此三款軟件目前在各自所處的二代和三代測序技術(shù)領(lǐng)域其性能仍處于國際先進(jìn)或領(lǐng)先水平。

    基因組裝軟件的研發(fā)主要挑戰(zhàn)除了計算極端耗時之外,還需要超大內(nèi)存空間以及組裝質(zhì)量和可靠性問題,也就是糾錯問題。基因組裝一般需要超級計算機或計算集群。而這三個方面也是評判一款基因測序軟件的基本標(biāo)準(zhǔn)。
前兩款軟件主要是在計算時間和節(jié)省內(nèi)存空間方面的改進(jìn),與當(dāng)時最優(yōu)秀的同類軟件相比較,其計算效率(也就是縮短計算時間、減少內(nèi)存空間需求量)提高了10~1000倍。因此,采用該軟件可使得原來需要超級計算機的基因組裝計算,能夠在普通服務(wù)器(甚至辦公室工作站)上完成。

    綜合測試顯示:采用測序深度僅為30x的三代基因測序數(shù)據(jù),Sparc取得組裝共識時錯誤率低于0.5%;同時與目前最優(yōu)秀的同類軟件相比,Sparc可節(jié)省計算時間和內(nèi)存達(dá)80%。

    馬占山告訴《中國科學(xué)報》記者:“在三代測序領(lǐng)域的另一重要突破——如果大家都約定采用一致或類似的組裝質(zhì)量,我們的軟件對于測序深度的要求一般僅為同類其他軟件的一半,這意味Sparc/DBG2OLC有可能節(jié)省一半的測序成本?!?/P>

    類似于二代測序技術(shù),目前三代測序軟件已經(jīng)足以滿足三代測序儀(硬件)的需求?!拔覀兊募夹g(shù)其實已經(jīng)解決了三代技術(shù)與二代技術(shù)相比較的弱點,那就是計算量大(計算極端耗時、需要超高速和超大內(nèi)存的超級計算機或集群)和測序錯誤率超高的缺陷。而且,該技術(shù)也降低了成本。”因此,馬占山認(rèn)為三代測序技術(shù)今后推廣更多是市場開拓問題,而不是技術(shù)問題。

    值得一提的是,DBG2OLC 和 Sparc所開發(fā)的算法解決了最新三代技術(shù)最為復(fù)雜的關(guān)鍵技術(shù)難題。在測序硬件技術(shù)出現(xiàn)更新一代技術(shù)之前,這一領(lǐng)域軟件的發(fā)展已經(jīng)完全可以滿足硬件技術(shù)的需求。特別是最新Sparc算法的“線性復(fù)雜度”意味著該問題最高效率級別的算法已經(jīng)找到,為此,Sparc合作團隊已經(jīng)將軟件研發(fā)轉(zhuǎn)向生物醫(yī)學(xué)的另一熱點:腸道菌群與人體疾病和健康關(guān)系的研究。