記事一覧

強大的功能注釋工具 - ConsensusPathDB

      原創文章     引用請註明出處 


功能注釋(Functional Annotation)在基因體或轉錄體研究扮演非常重要的角色,最知名的網站工具以 DAVID 為代表(https://david.ncifcrf.gov/),DAVID 是一個功能相當強大的基因與功能分析平台,但由於其最後一次更新已距今三年半(DAVID 6.8 Oct. 2016),因此小編來為大家介紹一個同樣也功能強大且十年來持續有在更新及發表論文的網站 ConsensusPathDB (CPDB, http://cpdb.molgen.mpg.de/)。

cpdblogo.png 

CPDB 目前提供了三個物種的分析支援,包含人類、老鼠、酵母菌,最新版本更新於 2019 年 1 月 15日。CPDB 整合了蛋白質交互作用、基因遺傳資訊、代謝、生物訊號傳導、基因調控、藥物標靶交互作用與分子生化路徑等,資料收集自 32 個功用資料庫如知名的藥物資料庫 DrugBank & PharmGKB、蛋白質交互作用資料庫 BIND & Biogrid 與生物路徑資料庫 KEGG & Reactome 等。

CODB_info.png


現在一起體驗一下 CPDB 的強大,首先若是要針對一個基因集分析其所可能蘊含的功能,可以點選左方的「gene set analysis」後點選「over-representation analysis」,並把欲分析的基因列表貼到右方文字框中。另外,可以讓使用者自定義以 hypergeometric test 計算 p-value 時所使用的背景值,若沒提供則以 CPDB entities 大小作為背景值計算。最下方則是根據所輸入的基因名稱類型選擇進行轉換,例如: gene symbol。點選 Proceed 執行。

CPDB_overRepresentation.png


執行後可依據想分析的方向做選擇。(1) Network neighborhood-based entity sets (NESTs) (2) Pathway-based sets (3) Gene ontology categories (4) Protein complex-based gene sets

(1) Network neighborhood 的方式是以蛋白質交互作用建構核心網絡,亦即由一個 entity 出發往外尋找與之有作用的 entity,提供可選擇一層(1-next neighbors)或兩層(2-next neighbors)的網絡建構。

Network neighborhood

(2) Gene Ontology 分析可選擇自 level 2 到 level 5,並可根據想觀察的屬性分類(分子功能、生物途徑和細胞組成)選擇或全選。

GO_ProteinComplex.png


(3) Pathway:CPDB 收集來自 13 個 Pathway 資料庫的數據,分析時可以根據想看的目標資料庫做勾選或全選,另外也針對 overlap 的數量多寡(minimum overlap)及統計 p 值做初步篩選。

CPDB_Pathway.png

執行分析後可得到篩選後的顯著 Pathway 列表。其中 set size 欄位表該 Pathway 所包含的基因數量,candidates contained 欄位表 input 與該 pathway overlap 的基因個數及比例。

CPDB_Pathway_list.png

進一步,可以勾選幾個感興趣的 Pathway,點選最上方的「visualize selected sets」以網絡視覺化方式查看 Pathway-Pathway 間的關聯性。其中節點大小表 Pathway 組成的基因集大小,節點顏色表統計顯著程度,連線顏色表兩節點(Pathway)間共有的基因數量。

CPDB_pathway_network.png

看完介紹是不是覺得 CPDB 是一個非常完整、方便且強大的資料庫網站呢?尤其是它不需要寫任何的程式就可以完成各種基因ID類型的分析、基因功能注釋、統計顯著計算、互動式網絡繪製等分析,當然它可不只有這些功能喔!其他如 induced network modules 與 代謝物功能分析就留給大家自己試試看吧~~~



參考文獻
[1] Kamburov, A. et al. (2013) The ConsensusPathDB interaction database: 2013 update. Nucleic Acids Res.
[2] Kamburov, A. et al. (2011) ConsensusPathDB: toward a more complete picture of cell biology. Nucleic Acids Res.
[3] Kamburov, A. et al. (2009) ConsensusPathDB--a database for integrating human interaction networks. Nucleic Acids Res.
[4] Pentchev, K. et al. (2010) Evidence mining and novelty assessment of protein-protein interactions with the ConsensusPathDB plugin for Cytoscape. Bioinformatics



圖爾思生物科技 / 微生物體研究中心
郭育倫 文案


留言

發表留言

秘密留言