記事一覧

組裝新技術 10X Genomics linked Reads

隨著定序技術的發展,三代定序技術以其讀長較長、無GC偏好性等優勢,逐漸進入基因體組裝的隊伍中,然而比起二代定序,其成本依然較高,且錯誤率較高。10X Genomics 公司透過在序列中引入barcode 序列,製備出一種特殊的 library,透過Illumina二代定序,能夠得到跨度在30-100Kb的 linked reads 資訊,與二代定序資料相結合,在 Scaffold 的組裝上能夠得到媲美三代定序的組裝結果。


一、技術簡介  

10X Genomics 公司的 linked reads 技術本質上是將 barcode 序列引入長序列片段,透過將長片段分配到不同的油滴微粒中,利用 GemCode 平台對長片段序列進行擴增引入 barcode 序列以及定序接頭引物,然後將序列打斷成適合定序大小的片段進行定序,通過 barcode 序列資訊追踪來自每個大片段DNA模板的多個 Reads,從而獲得大片段的遺傳資訊。通過 linked reads 結合常規二代定序組裝得到的Scaffold,可建構準確度更長的Scaffold(圖2)。

tech_linked_reads.png


圖1. Linked reads Library構建過程[1]

flowchart_linked_reads.png 
圖2. 10X Genomics linked reads輔助基因體組裝流程圖


二、技術優勢  

(1) 微量樣本:僅需1ng 基因體DNA即可進行長片段建庫

(2) 精確分區:由於擁有眾多的barcode和Partions,可對DNA進行精確分區(表1)

(3) 長片段資訊:該技術可與Illumina定序儀進行無縫對接,利用短Reads可獲得長達100Kb的片段

(4) 基因體組裝品質提升:利用長片段資訊結合Illumina組裝資訊組裝的ScaffoldN50長度比單純用    Illumina方法提高十幾倍(圖3,表2)



表1. 不同barcode平台的分區及barcode數量
diff_barcode.png

注:Chromimum為Gemcode升級版的平台;


diff_scaffold_N50.png 
表2 不同組裝策略組裝基因體大小和ScaffoldN50


linkedreads_assembly.png
圖3. Linked reads輔助基因體組裝示意圖


三、案例解析  

以人的基因體拼接為例,採用 Soapdenovo 對人的基因體NA12878的Illumina short-reads進行拼接。去除小於3Kb的Scaffold,得到的Contig N50為11.1Kb,Scaffold N50為590Kb,在此基礎上利用10X GemCode平台對人的基因體NA12878進行Library製備,最終得到97X的 linked reads 資訊,在原有的基礎上加上 linked reads 對基因體進行組裝,組裝為 super-Scaffold(圖4)。Scaffold N50的長度由原來的590Kb延長到7.03Mb,Scaffold的數量也由原來的14,047減少到5,697個,ScaffoldN50長度提高了將近12倍。同時組裝基因體的總長度也比原來有所提高,由原來的2.79Gb到現在的2.81Gb。另外該技術還可以和其他長片段定序技術(光學圖譜)結合,如果在此基礎上增加光學圖譜的資料可使組裝的Scaffold長度最長可達到99.96Mb(表3)。

Linked-reads.png
圖4. Linked reads 輔助基因體組裝


表3. 不同組裝策略組裝的Scaffold長度[2]
summary_human_NA12878.png



為了驗證組裝的 Scaffold 是否正確,我們對組裝序列與參考基因體進行比對,發現利用此方法組裝基因體完整性達95.2%,遠高於 ALLPATHS-LG 的組裝。同時為進一步驗證組裝的準確性,對組裝序列的外顯子進行比對發現95.7%的外顯子在組裝的新序列中。另外透過與參考基因體進行比對發現,在NA12878中存在14.3Mb的區域,這些區域在參考基因體中是不存在的,反映了不同人的NA12878和參考基因體的差異。

以上結果顯示利用10X Genomics linked reads方法能夠顯著提高Illumina short read組裝的Scaffold的長度,而且組裝的基因體具有較高的準確性。
 
 
參考文獻

[1] Zheng GXY, Lau BT,Schnall-Levin M, et al . Haplotyping germline and cancer genomes with high-throughput linked-read sequencing. Nature Biotechnology , 2016.
[2] Mostovoy Y, Levy-SakinM, Lam J, et al . A hybrid approach for de novo human genome sequence assembly and phasing. Nature Methods , 2016.



圖爾思生物科技 / 諾禾致源文案

留言

等待許可的留言

此留言需要管理員的許可

發表留言

秘密留言