您好,歡迎光臨武漢貝納科技服務有限公司
027-62435310 | service@benagen.com | 中文 | English 咨詢客服
您現在的位置:主頁 > 市場與支持 > 文獻解讀 >

應用Nanopore測序從微生物組中獲得細菌

細菌基因組中通常存在重復元件,導致二代宏基因組測序很難從人糞便樣品中直接獲得細菌完成圖。最新發表在Nature Biotechnology的文章提出應用Nanopore測序和Lathe組裝分析流程,將長reads和短reads糾錯相結合,可以從復雜的微生物中組裝出細菌完成圖。相對于與PacBio測序和讀云(使用10×genomics)測序的方法,Nanopore測序更容易從環境樣品中獲得細菌完成圖。
 
本研究應用Nanopore測序和Lathe組裝分析流程,使用短reads對將長reads進行糾錯,以便從復雜的微生物中組裝出細菌完成圖。首先將此方法用于測試12例細菌混合物,其中7個組裝出細菌完成圖,另外3個組裝出4個或少數contigs。而后將此方法應用于13個人的糞便樣品,組裝出20個細菌完成圖,包括Prevotella copriCibiobacter sp.。盡管較替代的測序和組裝方法,降低了核苷酸的準確性,但是此方法提高了組裝的連續性,有利于研究重復元件在微生物功能和適應中的作用。
 

發表雜志:Nature Biotechnology
發表日期:2020年2月
影響因子:31.864


研究背景

通過宏基因組組裝獲得細菌和古細菌的完整基因組(MAG)是微生物組研究的長期目標。由于受到重復元件的制約,現有的宏基因組測序和組裝方法通常不能獲得完整的細菌基因組。目前主流的組裝方法是:分箱、讀云測序等,雖然提高了MAG質量,但是對于正確組裝重復序列的能力有限。
重復元件的大小范圍在幾十bp到幾千bp。長的序列可以跨越整個常見的重復元件,如微型反向重復轉座子,轉座子,基因重復和前噬菌體序列。近年來,Nanopore和PacBio長讀長測序被應用于腸道和其他微生物組研究。但是由于缺乏從糞便中有效提取高質量DNA的方法,阻礙了長讀長測序在腸道微生物研究中的應用。
常規的球磨法,會導致大面積斷裂,雖然固相可逆固定化(SPRI)可以通過“清理”步驟去除數百bp的DNA片段,但這往往不能富集足夠長的DNA,以跨越細菌重復元件。溫和的球磨法可以減少斷裂,但很難從難以裂解的生物體中提取DNA。因此,需要有方法從革蘭氏陽性菌和革蘭氏陰性菌中提取可跨越重復元件的長DNA片段,以克服基因組組裝的局限性。
本研究提出了一種新的DNA提取方法和Lathe組裝流程,應用Nanopore測序,從復雜的微生物中組裝出細菌完成圖。
 

研究思路

材料和方法

12種標準的ATCC革蘭氏陽性菌和革蘭氏陰性菌混合物,用于模擬群落水平測試新方法的可行性。
2個人(斯坦福大學根據IRB批準招募的2名健康成年志愿者)的糞便樣本:P1,P2-A(這兩個樣本以前曾用于評估讀云和短讀長測序)和P2-B樣品(從個體 P2取得第一個樣本15個月后收集的糞便樣本)。用于在自然群體上測試新方法的可行性。
另外10個健康成人(斯坦福大學根據IRB批準招募的10名健康成年志愿者)的糞便標本(樣本A-J),用于評估新方法的普適性。
 


補充圖1 DNA提取和Lathe組裝分析流程

 
DNA提取方法:使用多種酶降解細胞壁,苯酚-氯仿提取,使用RNase A 和蛋白酶 k 消化,過柱純化和 SPRI 片段篩選等步驟。

Lathe組裝分析流程:對長讀長數據basecalling之后,使用Canu或Flye的不同參數組裝2次;使用Racon,Medaka和Pilon進行糾錯;Merging 2個結果;循環化;通過短讀長和長讀長一致性序列進行糾錯;再一次識別和去除組裝錯誤。
所有樣品均使用Nanopore MinION平臺測序,每個樣品各測1張芯片。同時使用Nanopore測序、短讀長測序,讀云測序和PacBio測序數據詳見補充表2。
 


補充表2 每個樣品的測序數據統計


主要結果

1.在12種細菌混合物上測試新方法


使用新的提取方法從混合樣品中提取得到401ng HMW DNA,使用納米孔測序,獲得30.3Gb數據,reads N50為5.9kb。混合物中12種細菌reads分類組成和基因組組裝結果見圖1。


圖1混合物中12種細菌的reads分類組成,reads長度分布和基因組組裝結果
 

使用Lathe組裝獲得N50為4.6Mb和總長度為48Mb,與已知的參考基因組長度一致。Lathe與其他長讀長組裝軟件以及混合組裝軟件相比,N50分別提高了1.6-4倍和2-9倍(補充表4)。相比之下,SPAdes組裝N50為133Kb,而用Lathe組裝相同數據量的納米孔數據,N50為3.3Mb,比短讀長組裝提高了25倍。


補充表4 不同組裝軟件的比較
注:*Reference length: 48.4 Mbp


在12種細菌混合物中,獲得7個細菌完成圖(圖1)。另外3個細菌基因組裝得到4個contig或少數contig;即使是組裝最不完整的基因組,其中1個contig也包含了83%的基因組。

 
2. 人糞便樣品上測試新方法

接著,將新方法應用于3個糞便樣本,每個樣品300mg。采用新的提取方法從每個糞便樣品得到至少1 μg的 HMW DNA。
經過納米孔測序后,P1、P2-A和P2-B樣品分別獲得12.7、6.1和7.6Gb數據,reads N50 分別為4.7、3.0和3.0kb。使用新組裝方法獲得的reads分類組成,比讀云和短讀長測序,具有更高的物種多樣性(圖2)。并能檢測到200多個通過短讀長檢測到的屬。

圖2 兩個健康成人的糞便微生物群落中,每個細菌組裝的連續性、多樣性和reads分類組成。
 
P1、P2-A和P2-B樣品用Lathe組裝獲得N50分別為236、221和179kb,總大小分別為139、83和87Mb。相比之下,盡管P1和P2-A的短讀長和讀云測序的數據量是納米孔測序的3-6倍,但是短讀長N50分別為34和15kb,讀云組裝N50分別為116和12kb,均比Lathe 組裝的N50低。


 


補充表5 不同樣品組裝結果統計

 

值得一提的是,PacBio測序比納米孔測序的組裝結果更加碎片化,這可能是由于PacBio是循環一致性測序,導致即使在覆蓋率很高的區域,也留下了零覆蓋的缺口。將PacBio組裝結果比對到納米孔上,一共發現7,630個2bp以上的gap。例如,Nanopore測序獲得了一個完整的Prevotella copri基因組,而PacBio測序只獲得了Phascolarctobacterium faecium基因組草圖。

補充說明圖2 Nanopore和PacBio測序reads 分別在Nanopore組裝的細菌基因組上的覆蓋深度
 

分別對納米孔、讀云和短讀長組裝的基因組進行完整性評估,長讀長以較低的成本獲得了比讀云更連續的組裝結果(圖2),產生了幾個N50大于2Mb的高質量基因組,而讀云只產生了1個,短讀長方法產生的組裝N50均不大于0.55Mb。納米孔測序從每個樣本中組裝獲得了幾個細菌完成圖,包括 Dialister sp., Faecalibacterium prausnitzii, Oscillibacter sp.和P. faecium 的基因組,而讀云和短讀長組裝的結果都是片段化的(圖 2)。
 
從3個糞便樣品中使用Canu組裝,可以獲得了8個高質量的單contig細菌基因組,其中最大的5個來自同一個樣品,而短讀長和讀云組裝了0個。Lathe獲得了5個準確的細菌完成圖,測序深度在75X(Oscillibacter sp.)-785X(P. copri),與已發表的基因組序列結構一致,序列相似。

 


表1 從人類糞便樣本組裝獲得的細菌完成圖

 

3.評估普適性

最后,使用另外10個健康成人糞便樣品評估新方法的普適性,并測試HMW DNA提取方法與常規的球磨法是否產生相同的分類結果。采用HMW DNA提取方法從10個樣品中獲得了合適長度的DNA,進行納米孔測序,獲得13-27Gb,原始數據reads N50為1.4-5.2kb,結合1.9-3.6Gb較低深度的短讀長數據進行一致性糾錯后確定分類組成(補充表2)。
 
同一個樣品,采用球磨法獲得的DNA進行納米孔測序產生的reads N50為2.5kb,數據量為6.3Gb;采用HMW DNA提取法獲得的DNA進行納米孔測序產生的reads N50為2.7kb,數據量為15.9Gb。兩種提取方法的納米孔測序數據產生了相似的分類組成。
 
比較球磨法提取DNA后短讀長測序和HMW DNA提取DNA后納米孔測序的reads分類,兩種方法之間的皮爾遜相關系數為0.79(n=10)。在18,642例特定物種的相對豐度超過另外一種方法的10 倍或更大差異時,本研究的方法產生了較高的相對豐度,表明新方法有可能提高分類靈敏度。
 
10個樣本的組裝序列總長度在48-207Mb之間和N50在51-120kb之間(補充表 5)。與P1和P2獲得的組裝結果相比,這個數值略低,可能是使用了Flye軟件代替了Canu,從而使計算成本大大降低,連續性適度減少(補充表4)。
 
在需要高度連續的情況下,例如試圖生成一個新的細菌完成圖,或者需要對結構變異或水平轉移染色體區域進行檢測,Canu可能是首選。但是,當目標是獲得盡可能多的高質量基因組和需要優先考慮成本的時候,Flye可能是首選。
 
特別值得注意的是P. copri 基因組圈圖(圖 3a),雖然之前嘗試使用讀云、短讀長和混合組裝,但N50從未超過130kb。主要由于其具有高重復性,這些高拷貝數元件通常位于短讀長和讀云組裝結果中斷的位置,而在本研究得到了細菌完成圖。

 

圖3 P. copri Cibiobacter sp.的基因組圈圖
 
F. prausnitzii基因組與現有參考菌株之間高度分化,所以利用16S rRNA基因進行分類。所有最高的6個16S rRNA序列均位于甲酸芽殖菌(平均同源性為98.11%)和Subdoligranulum variabile (平均同源性為 98.19%)之間,而與F. prausnitzii 菌株的16S rRNA 序列同源性僅為92.63%,這表明該基因組可能是最近描述的Cibiobacter clade的一個成員,并可能代表該屬的一個細菌完成圖(圖 3b)。在基因組中,發現了五個長度在8.5-65.9kb的前噬菌體。
 
此外,我們從10個樣本中使用Flye組裝獲得了11個細菌完成圖。其中包括另一個完整的Prevotella基因組,屬于一個與 CAG:386 密切相關的物種 (比對率92%,同源性為98%),代表一個完整的參考物種。總共獲得了19個高質量的基因組,其中16個N50大于1 Mb,12個N50大于2 Mb。另外還有22個基因組符合這些標準,最小完整度降低到75%。總共有1219個基因組草圖被獲取,污染率為 5%,完整性在0.31%到100%之間,平均為23%。


總結

本研究應用Nanopore測序和Lathe組裝分析流程,使用短reads對長reads進行糾錯,以便從復雜的微生物中組裝出細菌完成圖。首先將此方法用于測試12例細菌混合物,其中7個組裝出細菌完成圖,另外3個組裝出4個或少數contigs。而后將此方法應用于13個人的糞便樣品,組裝出20個細菌完成圖,包括Prevotella copri和Cibiobacter sp.。盡管較替代的測序和組裝方法,降低了核苷酸的準確性,但是此方法提高了組裝的連續性,有利于研究重復元件在微生物功能和適應中的作用。

Copyright ? 2018 武漢貝納科技服務有限公司 . All Rights Reserved. Designed by 鄂ICP備13016520號-1技術支持:中網維優
狠狠躁夜夜躁人人爽天天古典,伊人久久大香线蕉综合爱,国产黄在线观看免费观看},美女脱18以下禁止看。。。