記事一覧

RNA-seq中GO、KEGG結果圖如何解讀

GO
(gene ontology)資料庫,收集的是對各種物種基因功能進行限定和描述的標準詞彙(term),是國際標準化的基因功能描述分類系統。根據基因產物的相關生物學過程( biological_process)、細胞組成 (cellular_component)以及分子功能(molecular_function)三個大類分別給予定義,而每一大類下又包含更多層級具體term,這些定義與具體物種無關。


KEGG
(Kyoto Encyclopedia of Genes and Genomes)是一個綜合資料庫,整合了基因體資訊、化學資訊和生化系統功能資訊,目前包含了16個子資料庫。比如,KEGG PATHWAY資料庫包含了圖解的細胞代謝、膜轉運、訊號傳導等路徑信息; KEGG GENES資料庫、KEGG GENOME資料庫則包含了部分或者完整序列的基因/基因體資訊;KEGG Orthology(KO)是KEGG直系同源資料庫,將各個KEGG註釋系統聯繫在一起,將分子網路和基因體資訊連結起來,根據直系同源關係,實現跨物種的基因體或轉錄體的功能註釋。


GO 功能分類

GO.png 


圖示解析:

  1. 橫座標:GO三個基本分類(Biological Process、Cellular Component、Molecular Function)以及各類的下一層級term,從中可以看到描述 BP、CC或MF的具體term有哪些。透過該圖對應的表格可以查找某一個基因的具體功能資訊。
  2. 縱座標:


有向無環圖


DAG2.png   



圖示解析:




2. RNA-seq中,對差異表現基因進行GO富集分析,採用topGO實現有向無環圖,展示差異基因富集的GO term及其層級關係,從上至下所定義的功能範圍越來越具體。


3. 對BP、CC、MF三大類各取富集程度最高的前10位作為DAG圖主節點(方框表示),通過包含關係(is_a和part_of)將相關聯的GO term一起展示,顏色越深代表富集程度越高,可以看出某一個term可以有多個箭頭指向。比如biological process term "hexose biosynthesis" 有兩個parents:"hexose metabolism"和"monosaccharide biosynthesis",這是因為生物合成是代謝的一種,而己糖又是單醣的一種。


4. 每一個節點(方框or橢圓),包含4行資訊:GO term的id、該term的描述、GO富集的Corrected P-Value、該term下差異基因的數量/該term下基因體基因數的背景值。




散點圖


KEGG_pathway_scatterplot.png


1. RNA-seq中,對差異表現基因進行KEGG富集分析,可以通過散點圖展示。此圖中,KEGG富集程度通過Rich factor、qvalue和富集到此通路上的基因個數來衡量。

2. 橫坐標是Rich factor,數值越大表示富集程度越大。Rich factor=位於該pathway term下的差異表現基因數 / 位於該pathway term下的全部有註釋的基因數,可以視為比例。

3. 縱坐標是富集程度較高的pathway term(一般選取富集最顯著的20條進行展示,不足20條則全部列出)。

4. q value是經過多重校驗的p value,取值範圍[0,1],以顏色表示,越紅表示q value越小,說明富集越明顯。
5. 點的大小表示該term下差異基因的個數,點越大表示基因數越多。




KEGG 通路圖


pathway_plot.png 


圖示解析:

1. RNA-seq中,KEGG通路圖是展示差異表現基因所存在的路徑資訊。

2. 對於有參考基因體的物種,RNA-seq獲得的差異基因構建KEGG路徑圖時可以選擇物種特異性路徑圖(Organism-specificpathway map),物種相關的通路節點以綠色背景的方框表示。

3. 節點(矩形框)代表某一基因、該基因編碼 (encode)的酵素及這個酵素參與的反應。框中的數字是EC編號。網頁版通路圖分析結果中,點選該節點可以獲得具體的資訊(如下圖)。550369是KEGG中的基因ID,T01004是物種分類編號,然後是基因的名稱,屬於哪個KO分類以及表達的基因產物,對應的物種資訊,參與哪些代謝途徑,下面還有結構、序列資訊等等。


KEGG2.png 


4. 紅色邊框表示該差異基因是表現量增加的,綠色邊框表示表現量下降的。上圖展示的是有參轉錄體差異基因參與的類固醇生物合成途徑。有時還會遇到黃色邊框標註的,表示基因表現量既有增加的也有減少的。粉色邊框表示該節點是有差異的,但不區分具體增加、減少。


KEGG通路圖中各種符號的含義:

pathway_symbol.png


這樣你有清楚知道GO跟KEGG如何解讀了嗎?希望能對研究中水深火熱的你帶來一點點的幫助~



圖爾思生物科技 / 諾禾致源文案
http://www.toolsbiotech.com/

留言

發表留言

秘密留言