您好,歡迎光臨武漢貝納科技服務有限公司
027-62435310 | service@benagen.com | 中文 | English 咨詢客服
您現在的位置:主頁 > 市場與支持 > 文獻解讀 >

利用Nanopore測序和光學圖譜實現植物基因組的染色

應用Nanopore測序和光學圖譜實現植物基因組染色體水平組裝

 
植物基因組測序用什么平臺好呢?相信這個問題困擾了很多科研工作者,2018年11月發表在Nature Plants上的一篇文章,通過比較已發表的105種植物基因組,會為您揭曉答案。
 

發表期刊:Nature plants
發表時間:2018年11月
影響因子:13.297

由于具有高重復和多倍性的特性,植物基因組的組裝具有一定的挑戰性。如何獲得高質量的植物基因組序列,一直是科研工作者不斷探索的問題。
縱觀已發表的文章,可以看出,隨著測序技術的發展,植物基因組組裝結果越來越接近染色體水平,圖1展示了105種植物基因組的組裝結果。


圖1 105種植物基因組的組裝結果對比圖

 
通過比較已發表的105種植物基因組的組裝結果發現:
1.利用Sanger測序獲得的雙子葉模式植物擬南芥和單子葉模式植物水稻基因組組裝質量都很好,至今仍然屬于組裝最好的植物基因組。
2.二代短讀長測序技術的出現,使得超過200種植物基因組發表,但是大多數的組裝質量不高,由成千上萬條scaffold組成,尤其是富含轉座元件的區域,組裝得很碎。
3.三代長讀長技術可獲得較高質量的組裝序列,contig N50可以達到1Mb以上,但是仍然不能達到染色體水平,只有6種植物基因組contig N50>5Mb。
4.而作者利用ONT+BioNano的組合策略獲得的3種植物(蕪青、甘藍和香蕉)基因組contig N50均大于5Mb,且scaffold達到了染色體或染色體臂水平(圖1)。

 

材料和方法

B. rapa(Z1),B. oleracea(HDEM)和M. schizocarpa 3個物種,分別采用Illumina HiSeq2500 雙末端測序、Nanopore單分子納米孔測序(MinION或PromethION),并使用BioNano輔助組裝。
首先分別使用Ra,SMARTdenovo39和wtdbg分別對Nanopore長reads進行組裝,Ra的組裝結果最優;使用Racon和pilon分別進行3輪糾錯;對組裝結果進行polish;BUSCO評估完整度有很大改善;最后使用Bionano Solve Pipeline進行優化,得到最終組裝序列。
 


研究結果

1、獲得高質量組裝序列
B. rapa(Z1),B. oleracea(HDEM)和M. schizocarpa 3個物種分別使用MinION測序產生79X、32X、44X的數據,其中大于50Kb的reads覆蓋度在4.4X-8.2X。初步組裝得到contig N50在3.8Mb-7.3Mb,contig數均小于1000條。使用光學圖譜掛載后,最終contig N50在5.5-9.5Mb,scaffold N50在15.4-36.8Mb (表1)。組裝指標較已發表版本提升了100倍和450倍。
 
表1 3個物種組裝結果統計

 

1/4的染色體是由單條scaffold組成,66%的染色體由一條或者兩條scaffold組成。例如,香蕉的7號染色體由一條scaffold組成,跨越兩端端粒重復區域,且包含4 Mb的高密度著絲粒重復區域。


 

2repeat 區域的完整性提高

B. rapa、B. oleracea、M. ocarpa進行注釋,分別預測到46,72161,279和32,809個基因,與已發表的結果一致。
相比以前使用短讀長的版本,本文基因組預測到的LINE、LTR和DNA轉座子家族所占的比例更高,轉座元件的平均長度更長。在B. rapa, B. oleraceaM. ocarpa中分別多預測了14.95%,37.95%和59.95%的copia元件。表明長讀長組裝的基因組豐富了轉座元件類型的完整性以及完善了轉座元件富集區的基因組結構(圖2)。

圖2 3個物種注釋結果與參考基因組的比較


3相比于測序深度,更長的reads對提升組裝結果更有效

對近期發表的用PacBio測序的6個物種與這3個物種的組裝結果(基因組大小在130-630Mb之間)進行比較,發現:
(1)ONT數據中長reads(大于50kb)的比例較高;而PacBio數據的覆蓋率更高(在125×到283×之間)。表明PacBio需要更高的覆蓋率以獲得足夠數量的長reads對基因組組裝指標進行提升。
(2)PacBio測序的植物基因組(除月季外)得到的contig N50都較低,是因為該技術很難得到長reads。
(3)在這9個物種中,contig N50第二好(9.5 Mb)的ONT測序reads深度只有36X,但是讀長最長(reads的N50可以達到31 kb)。表明相比于測序深度,更長的reads對提升組裝結果更有效;30X的長reads能夠滿足組裝的需求。
 


4、新組裝的基因組質量更優

為了比較基因組的組裝質量,將199 份B. rapa 和119 份B. oleracea的重測序數據分別比對到參考基因組和新組裝的基因組,比對到新組裝的蕪青和甘藍的比對率分別高出0.61%和2.77%。表明新組裝的結果更適合作為后續蕓薹屬重測序分析中的參考序列。
 


5、開花基因和S-位點

本研究分析了FLC基因,該基因與春化和開花時間相關。FLC基因家族的拷貝數變化,可以影響開花時間。在甘藍中檢測到7種FLC基因;在蕪青中檢測到4種FLC基因。表明長reads更有利于重復區域的組裝。
作者研究了S-位點,S-位點是長度約30-150Kb的轉座元件富集區域,使用短讀長較難完整地組裝出來。在蕪青中,檢測到一條完整的,長度為48 Kb的S-位點;在甘藍中,檢測到一條跨越102Kb區域的S-位點。

 

6著絲粒區域和R-基因

通過M. schizocarpa 與M. acuminate全基因組比較分析,發現著絲粒區域顯示出高度的變異。M. acuminate 的2個基因組更片段化。這一結果表明,長的contig定位著絲粒的重要性。
此外,本研究還檢測了R-基因,一般成簇出現,很難正確組裝。M. schizocarpa 與M. acuminate的3個同源R-基因簇的不確定堿基比例,分別為6.5% 和 0%,表明長reads對復雜區域組裝的重要性。

 

結論

本研究提出了結合ONT,BioNano和Illumina三種技術,分別獲得蕪青、甘藍和香蕉的高質量基因組,與已發表基因組相比,新組裝的基因組組裝指標有了質的提升,尤其是富含轉座元件的區域。
Copyright ? 2018 武漢貝納科技服務有限公司 . All Rights Reserved. Designed by 鄂ICP備13016520號-1技術支持:中網維優
狠狠躁夜夜躁人人爽天天古典,伊人久久大香线蕉综合爱,国产黄在线观看免费观看},美女脱18以下禁止看。。。