記事一覧

Tax4fun 菌群功能預測

     原創文章     引用請註明出處

Tax4fun是一個以R 語言開發的基因功能預測套件,能依據 16S 數據進行菌群功能預測。與 PICRUSt 同是基於 marker gene 進行總體基因體功能預測的工具。相較 PICRUSt 推斷序列共同祖先後預測基因功能,Tax4fun 是基於透過 KEGG 原核基因體註釋資訊的序列直接地進行基因功能預測。Tax4Fun 使用 SILVA(Release 123) 作為資料庫來源,並基於此資料庫標記的 OTU 物種豐度進行功能預測。與PICRUSt 使用的 GreenGenes 資料庫相比,SILVA 資料庫的更新週期更為穩定且頻繁。

分析流程首先將基於 SILVA 的 16S rRNA 資訊,依據事前計算的關聯式矩陣線性轉換成 KEGG 原核生物的注釋資訊。接著,透過從 NCBI 基因體註釋獲得的 16S rRNA 拷貝數來標準化 KEGG 測量的生物豐度。最後,將歸一化的分類單元豐度線性組合於預先計算的 KEGG 生物的功能圖譜,以預測微生物群落的基因功能。

tax4fun KEGG_NMDS
圖1. Tax4fun KEGG功能預測NMDS分析圖

Tax4fun分析輸出結果包含:KEGG ORTHOLOGY 第四層每個代謝路徑圖的注釋資訊;KEGG PATHWAY 資料庫六大類生物代謝路徑中,屬於代謝 (Metabolism)類別的第三層代謝路徑圖的資訊。此外,Tax4fun 提供了 FTU (Fraction Taxonomic units Unexplained)數值,其代表序列與分類單元關聯性矩陣中未能成功與 KEGG 資料庫注釋資訊產生對應關係的序列比例。

tax4fun KEGG_level3
圖2. 組間統計顯著基因功能豐度柱狀圖 


參考文獻
P. Aßhauer, B.W., R. Daniel, P. Meinicke, Tax4Fun: predicting functional profiles from metagenomic 16S rRNA data. Bioinformatics, 2015. 31(17): p. 2882-2884.


圖爾思生物科技 / 微生物體研究中心
郭育倫 文案

© BIOTOOLS. All Rights Reserved

留言

發表留言

秘密留言