您好,歡迎光臨武漢貝納科技服務有限公司
027-62435310 | service@benagen.com | 中文 | English 咨詢客服
您現在的位置:主頁 > 市場與支持 > 文獻解讀 >

人類poly-A轉錄組的Nanopore Direct RNA測序


 
隨著測序技術的發展,轉錄組測序已成為研究基因表達調控的重要手段。傳統的轉錄組測序需經過RNA反轉錄后,進行PCR,對PCR結果進行測序。這種方法,丟失了生物體內RNA的原始信息,且堿基修飾無法保留。最近出現的基于Nanopore 平臺的Direct RNA測序技術,是對RNA直接測序,與傳統轉錄組測序不同的是,Direct RNA測序能夠保留并檢測RNA堿基修飾信息,并能相對準確的估算ploy(A)尾長,還原真實的RNA特征。
 
下面我們以2019年11月發表在《Nature Methods》上的一篇文章為例,詳細介紹Direct RNA測序的研究思路。

發表期刊:Nature Methods
發表時間:2019年11月
影響因子:28.467
 
研究材料
分別來自英國哥倫比亞大學、加拿大安大略癌癥研究所、美國約翰霍普金斯大學、美國加州大學圣克魯茲分校、英國諾丁漢大學、英國伯明翰大學的6個人B淋巴細胞系(GM12878)。
 
研究思路
從人B淋巴細胞系GM12878中分離RNA,進行Direct RNA測序,同時取相同的樣品進行cDNA測序,應用MinION平臺對每個研究機構的樣品各測5張芯片,一共測30張芯片。獲得的結果用于下游分析:isoform分析,等位基因分析,poly(A)尾長度分析,堿基修飾分析等。

圖1 Nanopore Direct RNA 測序流程

研究方法
對分離的RNA,富集含有Poly-A序列,反轉錄成第一條cDNA鏈,加測序接頭,再加馬達蛋白,直接對RNA測一張芯片,獲得RNA序列和修飾信息,詳見圖1a。
 
研究結果
 
Direct RNA數據統計

一共測序30張芯片,獲得13M條reads,過濾后得到10.3M條reads。每張芯片過濾后的reads N50為1,334bp,中位數為771bp。比對到GRCh38人基因組上的reads數超過9,900,000條。
 
Nanopore Direct RNA測序數據中位數一致性為86±0.86%(圖2a)。錯配、插入和缺失分別為2.4%、4.3%和4.4%。G-for-C和C-for-G的錯誤率分別為0.38%和0.47%;C-to-U和U-to-C的錯誤率分別為3.62%和2.23%(圖2b)。將得到的reads長度與GENCODE v27中已知轉錄本長度進行比較,結果基本一致(圖2c)。


圖2 Nanopore Direct RNA 測序性能統計
 
與Nanopore cDNA測序的結果相比,中位數一致性為85%,與最近發表的Nanopore DNA結果一致。cDNA測序數據的替換錯誤類型與Direct RNA測序數據相似。
 

線粒體RNA評估納米孔的測序性能

線粒體 RNA 因其含量豐富,單外顯子,長度差異大(349-2379 nt)的特性,可被用于評估納米孔的測序性能,結果表明,約10%的reads與線粒體基因組一致(圖3a)。


圖3 線粒體 poly(A) 轉錄本

線粒體RNA(MT-RNA) reads 長度分析顯示,比對到MT-CO2和MT-ND4L/MT-ND4上的優勢reads長度與預期相符(圖3b)。
 

isoform 檢測和分析

Nanopore 長讀長可以提高RNA外顯子與外顯子連接區域的分辨率,從而挖掘未注釋的isoform。應用Nanopore Direct RNA測序,結合FLAIR工具,鑒定到10793個基因,這些基因一共注釋到33984個isoform,52.6%未注釋到剪切位點 (占總reads的13.0%)(圖4a)。
 
研究發現非編碼基因的剪切類型比編碼基因更為復雜(圖4b),這與之前的研究結果一致。


圖4 Direct RNA測序的isoform分析
 

等位基因鑒定

長讀長Nanopore RNA reads更容易鑒定等位基因,因為遇到雜合SNP的幾率更大。本研究發現了3751個基因,其中3707個來自常染色體,44個來自X染色體。且23個特異的X-連鎖基因中有22個來自于母系等位基因,唯一的父系表達的X-連鎖基因,編碼長鏈非編碼RNA XIST,可以調控女性的X失活。
 
同時,鑒定到5個isoform來自不同親本的基因。例如IFIH1基因中,來自父本isoform保留了外顯子8,而來自母本的isoform不保留(圖4d)。該轉錄本在等位基因分配中,最近的SNV距離可變剪接事件長達886 nt,而用短讀長測序無法檢測到的。
 

3′ poly(A) 分析

poly(A)尾在轉錄后調控中發揮重要作用,包括mRNA穩定性和翻譯有效性。這些均聚物長達數百個核苷酸,所以短讀長測序數據很難檢測到。本研究使用與3' poly (A)相關的低方差電流信號(圖1b),利用nanopolish-polya算法,通過校正RNA分子通過納米孔的速度,估算poly (A)尾長度。
 
結果顯示,線粒體poly(A)的長度分布集中在~50 nt,不超過100 nt,轉錄本poly(A)平均長度為52 nt。這與其他人細胞系的線粒體poly(A) RNA結果一致。而核轉錄本的長度分布更加廣泛,峰值為58 nt,平均值為112 nt,大量poly(A) 尾大于200 nt。
 
該方法還發現了同一個基因的不同isoform之間poly(A)尾的區別。例如DDX5的兩個isoform,一個是內含子保留型,poly(A)尾中位數長度為327nt,另外一個是編碼蛋白型,poly(A)尾中位數長度為125 nt(圖5c)。



圖5 利用nanopolish-polya算法估算poly(A)尾長度
 

作者繼續探索poly(A)尾長度與內含子保留之間的關系,結果表明,內含子保留型轉錄本的ploy(A)尾比不含內含子的轉錄本長(中位數分別為232nt 和91nt)(圖5d)。

 
修飾檢測

Nanopore測序可以鑒定DNA 和RNA的堿基修飾。m6A是最常見的一種mRNA內部修飾,與RNA代謝的許多方面相關。m6A失調被發現與肥胖癥和癌癥等人疾病相關。
 
本研究重點關注m6A甲基轉移酶復合物的一個亞基—甲基轉移酶3的GGACU結合序列,圖6a將EEF2中假定的m6A位點的原始電流信號與體外轉錄復制的信號進行對比,發現m6A導致了電流信號的改變。為了驗證這個結果,通過合成寡聚物(圖6b)進行比較,同樣檢測到明顯的電流差(圖6c)。
 

圖6 Nanopore Direct RNA測序檢測m6A修飾
 

對同一個基因的不同isoform之間 m6A修飾分析,結果顯示86個基因(198個isoform)的電流水平在isoform之間存在顯著差異。例如SNHG8基因(圖6d)。
 

總結

該研究使用Nanopore測序技術對人細胞系進行Direct RNA測序,檢測到52.6%未注釋到isoform,甚至可以鑒定到等位基因特異性isoform。估算了poly (A)尾長度,確認內含子保留型ploy(A)尾比不含內含子的長。并鑒定到了m6A堿基修飾信息,發現isoform之間 m6A修飾存在顯著差異。結果表明,Nanopore Direct RNA測序在研究轉錄后調控方面具有重要作用。
Copyright ? 2018 武漢貝納科技服務有限公司 . All Rights Reserved. Designed by 鄂ICP備13016520號-1技術支持:中網維優
狠狠躁夜夜躁人人爽天天古典,伊人久久大香线蕉综合爱,国产黄在线观看免费观看},美女脱18以下禁止看。。。