DNA甲基化是在DNA甲基化轉(zhuǎn)移酶(Dnmt)的作用下將甲基選擇性地添加到胞嘧啶上形成5-甲基胞嘧啶(5-mC)的過程。
DNA復(fù)制后胞嘧啶的甲基化會(huì)改變DNA的構(gòu)象,使DNA的大溝無法與DNA結(jié)合蛋白正常結(jié)合,從而使這些非編碼區(qū)長期保持無表達(dá)活性的狀態(tài)。而有轉(zhuǎn)錄活性的基因可利用非甲基化的啟動(dòng)子來進(jìn)行轉(zhuǎn)錄表達(dá)。
CpG位點(diǎn)(CpG sites)是指DNA的某個(gè)區(qū)域,其上的堿基序列以胞嘧啶接著鳥嘌呤出現(xiàn)。“CpG”是“C—磷酸—G”的縮寫。 CpG位點(diǎn)在人類基因組上并非隨機(jī)分布,在人類基因組上的頻率為1%。
• DNA甲基化主要發(fā)生在CpG位點(diǎn)。在哺乳動(dòng)物中,70%到80%的CpG位點(diǎn)的胞嘧啶是甲基化的。
• CpG島是一個(gè)富含CpG位點(diǎn)的區(qū)域,通常定義為:一個(gè)長度至少為200bp的片段
,其GC含量高于60%,主要位于基因的啟動(dòng)子區(qū)(70%的基因)。
二、全基因組甲基化研究策略優(yōu)點(diǎn):通量高 ,全基因組范圍;單堿基分辨率。
缺點(diǎn):成本高,不適于大樣本研究分析;不適于特異位點(diǎn)、基因或區(qū)段研究。
三、特異位點(diǎn)甲基化研究策略Bisulfite sequencing PCR (BSP): 基因組DNA經(jīng)亞硫酸氫鹽處理后,設(shè)計(jì)BSP引物擴(kuò)增目的片段,最后對PCR產(chǎn)物進(jìn)行克隆并選取8-10個(gè)轉(zhuǎn)化子序列,即可確定所研究的CpG區(qū)域的甲基化頻率。
Methylation specific PCR (MSP) :首先用亞硫酸氫鈉修飾處理基因組DNA,然后針對甲基化和非甲基化引物進(jìn)行PCR擴(kuò)增,確定與引物互補(bǔ)的DNA序列的甲基化狀態(tài)。
缺點(diǎn):通量太小、無法精確定量
翼和方法:
Bisulfite Amplicon Sequencing (BSAS)
優(yōu)勢:BSAS 結(jié)合了亞硫酸鹽轉(zhuǎn)換、靶向擴(kuò)增子高通量測序技術(shù),可實(shí)現(xiàn)多區(qū)段、多位點(diǎn)的甲基化精確定量分析。
應(yīng)用:1、 適用于感興趣的目的片段的甲基化研究 ;
2、適用于在大樣本中進(jìn)一步確認(rèn)全基因組甲基化研究挑選的陽性位點(diǎn)。
文獻(xiàn):1、 Masser et al. Epigenetics & Chromatin 2013, 6:33
2、Ashktorab et al. Epigenetics 2014, 9(4): 503-512
3、Beth et al. J CHILD PSYCHOL PSYC 2016,2(57):152-160
關(guān)鍵點(diǎn)-引物設(shè)計(jì)
盡量避免CpG位點(diǎn),無法避免時(shí),可設(shè)計(jì)兼并引物;
經(jīng)亞硫酸鹽處理后,兩條DNA鏈不再互補(bǔ),一般需要設(shè)計(jì)鏈特異性引物用于PCR擴(kuò)增;
如果只選一條鏈進(jìn)行研究,一般選擇正義鏈。
關(guān)鍵點(diǎn)-轉(zhuǎn)換效率
亞硫酸鹽處理是一化學(xué)過程,可造成DNA的損傷,很難同時(shí)實(shí)現(xiàn)100%的轉(zhuǎn)換效率和保持DNA的完整性,二者需要做出一定的平衡。
轉(zhuǎn)換效率 = 未轉(zhuǎn)換堿基讀數(shù)/總堿基讀數(shù) 【針對DNA序列中的C位點(diǎn)】
如何評估轉(zhuǎn)換效率?
在植物中,葉綠體中不含甲基胞嘧啶 DNA,因此,可用葉綠體DNA序列信息作為內(nèi)對照,評估轉(zhuǎn)換效率。
在動(dòng)物中,可通過在試驗(yàn)中加入未發(fā)生甲基化的外源DNA序列(通常為噬菌體DNA)來評估轉(zhuǎn)換效率;此外,還可利用CpG位點(diǎn)以外的C位點(diǎn)信息來評估。
關(guān)鍵點(diǎn)-目的片段富集
采用巢式PCR,確保目的片段有效富集
經(jīng)亞硫酸鹽處理后,DNA序列復(fù)雜度嚴(yán)重降低。應(yīng)嚴(yán)格控制建庫PCR的循環(huán)數(shù),降低非特異性擴(kuò)增。
通過將參考序列中的C堿基全部替換為T堿基,然后將測序reads比對到轉(zhuǎn)換后的參考序列上,針對每一個(gè)CpG位點(diǎn),統(tǒng)計(jì)C和T堿基的讀數(shù)(類似于SNP calling),來判斷該位點(diǎn)的甲基化。
甲基化率:對于每一個(gè)CpG位點(diǎn),甲基化率 = C堿基讀數(shù)/該位點(diǎn)測序覆蓋度。
甲基化狀態(tài):利用內(nèi)對照得出的轉(zhuǎn)換效率作為期望概率,通過二項(xiàng)分布統(tǒng)計(jì),得到p值,判斷每個(gè)CpG位點(diǎn)是否發(fā)生甲基化,多位點(diǎn)分析時(shí),通常需要對p值進(jìn)行矯正(錯(cuò)誤發(fā)生率,F(xiàn)DR)。