記事一覧

SNP分析知多少?

 基礎知識

概念篇

SNP(single nucleotide polymorphism),單核苷酸多型性,在基因體上由單個核苷酸變異形成的遺傳標記,一般指變異頻率大於1%的單核苷酸變異。

用英文的描述方法是:“If more than 1% of a population does not carry the same nucleotide at a specific position in the DNA sequence, then this variation can be classified as a SNP.”,值得注意的一個名詞是“population”同英文文章中對樣本表述的“array”,指的是在一大群個體中,出現大於1%個體中基因體DNA上某個特定位點鹼基與參考基因體相比有發生變化,則被認為是一個SNP。


SNP發生的類型

SNP發生包括轉換、顛換、插入和缺失,理論上每個位點都可以有4種形式的變異,但是實際上發生的只有轉換和顛換兩種,據說發生轉換和顛換頻率是2: 1。為了方便大家記憶,小編把轉換和顛換的概念獨立出來敘述如下:

轉換

[一種能量形式變成另外一種能量形式],主要發生在CG序列,由於CG(可以聯想一下研究DNA甲基化常談到的CpG islands)中的C鹼基常發生甲基化(mC ),可自發脫氨形成胸腺嘧啶(T),即常常發生的轉化是C to T。

顛換

異型鹼基的置換,一個嘌呤被另外一個嘧啶替換或一個嘧啶被另外一個嘌呤置換(很好理解,不再贅述)。


SNP發生的位置

一句話概括,SNP可以發生在基因體的任何位置,基因編碼區/基因非編碼區/基因間區等,關係如下:

SNP_flow1.png


發生在編碼區

先補充一個概念:密碼子簡併性(氨基酸對應三聯密碼子),所以發生SNP不一定會引起編碼氨基酸的改變,這就引入了Synonymous SNP(同義突變,不引起任何變化)和Non-Synonymous SNP(非同義突變,大家關注的焦點)概念。

錯義突變:編碼的某種氨基酸的密碼子變成另一種氨基酸密碼子,從而多肽鏈的氨基酸種類和序列發生改變,錯義突變通常會使多肽鏈喪失原有功能。

無義突變:編碼某一氨基酸的密碼子變成UAA、UGA或UAG(終止密碼子),導致多肽鏈翻譯的中止,從而形成一條不完整的多肽鏈。


發生在基因非編碼區或基因間區

可能會影響轉錄因子與DNA結合、影響非編碼RNA序列、影響基因的剪接、mRNA的降解等。

受到單核苷酸多態性(SNP)影響的基因表達被稱為單核苷酸多態性表達(ESNP)。


NGS與SNP分析

隨著定序成本不斷下降,二代定序技術成為檢測SNP主流手段,microarray 成為驗證試驗的不錯選擇。基因體和DNA外顯子定序檢測SNP這邊就不多做介紹了。
小編就帶大家看看mRNA-seq,SNP可以分析點什麼?

首先mRNAseq分析中的SNP 並非為嚴格意義上SNP的定義,用變異可能會更合適;其次mRNAseq中SNP分析主要分析外顯子區域發生的鹼基變異。

定序資料與參考基因體比對,透過分析得到基因體那些位置的鹼基發生了變化,由原來的什麼鹼基變成了什麼鹼基。
 
做了RNAseq分析,我們可以得到發生SNP基因資訊、位置資訊及SNP是否會引起翻譯蛋白質的改變,另外在一些非編碼RNA序列也可以推測是否會發生調控機制的變化。



終於說完了,大家有沒有對SNP有更深的了解呢?



圖爾思生物科技 / 諾禾致源文案

留言

等待許可的留言

此留言需要管理員的許可

發表留言

秘密留言