記事一覧

單細胞定序分析介紹 (五): 細胞標記 Cell type annotation


  
   原創文章     引用請註明出處 

細胞類型標記(細胞註釋)一直都是單細胞分析當中很重要的一環。對於樣本熟悉且經驗豐富的研究人員,也許可以透過細胞相關的 marker genes,加上該細胞的註釋,進而研究新的細胞亞群;這時
候,有一個整理完善的 cell marker database 就很重要了。

小編以下整理幾個資料庫供大家參考:

Marker-based
  • PanglaoDB [1]
目前(2020.5.25)收錄人類 305 個samples、74 個 tissues、1748 種 cell types (clusters, cell states)、來自 1,126,580 顆 cells;老鼠的部分則有 1063 個 samples、184 個 tissues、8,651 種cell types (clusters, cell states )、來自 4,459,768 顆 cells。資料來自 SRA (Sequence Read Archive)。

網址:
https://panglaodb.se/index.html

沒錯,眼尖的朋友就會發現這個資料庫上次提過啦~
(點它>>) 更多單細胞資料庫 (<<點它看更多介紹)

panglaoDB.png

  • SignatureDB [2]
主要收錄的是 Diffuse large B-cell lymphomas (DLBCLs, 瀰漫大B細胞淋巴瘤) 樣本。過往大概將DLBCL 分為兩個主要 subtype (activated B-cell–like [ABC]、 germinal-center B-cell–like [GCB]),在臨床上將使用不同的免疫療法及標靶治療方式,但對於其他 unclassified 的 DLBCL 在治療上可能會有缺憾。因此研究團隊提供更詳細分子層面的資訊,希望藉此幫助理解 DLBCL 的致病機制。

※僅提供清單下載、沒有視覺化呈現結果、實驗資料來自 RNA-seq/ Exome-seq/ DNA copy (array-based)/ Amplicon-seq 。

網址:
https://lymphochip.nih.gov/signaturedb/

SignatureDB.png

  • Cell Marker [3] 
這個資料庫以不同的組織器官分類,收錄人/鼠相對應的 cell markers。其中,人類包括 13,605 種cell markers、467 種 cell types、158 個 tissues/ sub-tissues;老鼠的部分則有 9,148 種 cell markers、389 種 cell types、81 個 tissues/ sub-tissues。Cell Marker 資料庫的好處是,每個 cell markers 有顯示作為細胞標記的支持文獻數,越醒目的 marker 即代表支持文獻數越高。

網址:
http://biocc.hrbmu.edu.cn/CellMarker/

cellmarker.png


當要推測單細胞分群當中某個 cell cluster 是什麼細胞類型的時候,找出 cell cluster 差異基因、透過以上幾種資料庫,即可確認可能的細胞類型。然而,對於未知的 cell cluster,往往不知道如何著手搜尋要怎麼辦呢?

小編這裡介紹兩個自動化標註套件給大家,因為套件自帶參考數據,並基於相關性模型計算相似度,所以可以協助判別細胞類型。

Reference-based
  • scMCA [4, 5]
內建資料庫主要收錄老鼠的 cell markers ,資料是以一種單細胞技術 Micorwell-seq 定出各部位老鼠器官的細胞資訊。在這個資料庫當中收錄 3,028 個 cell markers、 894 種 cell types。值得注意的是,這邊有些細胞過往沒有被定義,scMCA 會稱這些細胞為 XXX_high cells (XXX表示某個cell marker,例如 Macrophage_Pf4 high (Adult-Bladder))。

網址:
http://bis.zju.edu.cn/MCA/blast.html

scMCA.png

  • SingleR [6]
內建資料庫(v1.0.1)總共包含四類(人/鼠各2),而每一類又可拆為兩種(細分類型或主要類型),因此一個物種可以看到4大類。

【老鼠】
1. Immunological Genome Project (ImmGen)
20 main types and 253 subtypes

2. Mouse RNA-seq samples
18 main types and 28 subtypes

【人類】
1. Human Primary Cell Atlas (HPCA)
37 main types and 157 subtypes

2. Blueprint + Encode
24 main types and 43 subtypes

SingleR詳細介紹
因為 SingleR 是一個很受歡迎的套件,下一篇小編將介紹它的細胞標記概念與方法。


~敬~請~期~待~



參考資料:
1. Franzén, O., L.-M. Gan, and J.L.M. Björkegren, PanglaoDB: a web server for exploration of mouse and human single-cell RNA sequencing data. Database, 2019. 2019.
2. Schmitz, R., et al., Genetics and Pathogenesis of Diffuse Large B-Cell Lymphoma. N Engl J Med, 2018. 378(15): p. 1396-1407.
3. Zhang, X., et al., CellMarker: a manually curated resource of cell markers in human and mouse. Nucleic Acids Res, 2019. 47(D1): p. D721-d728.
4. Sun, H., et al., scMCA: A Tool to Define Mouse Cell Types Based on Single-Cell Digital Expression. Methods Mol Biol, 2019. 1935: p. 91-96.
5. Han, X., et al., Mapping the Mouse Cell Atlas by Microwell-Seq. Cell, 2018. 172(5): p. 1091-1107.e17.
6. Aran, D., et al., Reference-based analysis of lung single-cell sequencing reveals a transitional profibrotic macrophage. Nature Immunology, 2019. 20(2): p. 163-172.




圖爾思生物科技 / 微生物體研究中心
謝馥媺 文案


留言

發表留言

秘密留言