English | 中文版 | 手機版 企業(yè)登錄 | 個人登錄 | 郵件訂閱
當前位置 > 首頁 > 技術(shù)文章 > DNA甲基化研究的測序數(shù)據(jù)挖掘思路分享

DNA甲基化研究的測序數(shù)據(jù)挖掘思路分享

瀏覽次數(shù):756 發(fā)布日期:2023-2-24  來源:本站 僅供參考,謝絕轉(zhuǎn)載,否則責任自負
大家好,這里是專注表觀組學十余年,領(lǐng)跑多組學科研服務(wù)的易基因。

總體來說,DNA甲基化一般遵循三個步驟進行數(shù)據(jù)挖掘。

首先,進行整體全基因組甲基化變化的分析,包括平均甲基化水平變化、甲基化水平分布變化、降維分析、聚類分析、相關(guān)性分析等。

其次,進行甲基化差異水平分析,篩選具體差異基因,包括DMC/DMR/DMG鑒定、DMC/DMR在基因組元件上的分布、DMC/DMR的TF結(jié)合分析、時序甲基化數(shù)據(jù)的分析策略、DMG的功能分析等。

最后,將甲基化組學&轉(zhuǎn)錄組學關(guān)聯(lián)分析,包括Meta genes整體關(guān)聯(lián)、DMG-DEG對應關(guān)聯(lián)、網(wǎng)絡(luò)關(guān)聯(lián)等。

 

一、甲基化圖譜分析
(1)平均甲基化水平的比較
  • 平均甲基化水平能反應樣本整體的甲基化水平。
  • 但是平均水平差異不大并不能說明樣本間甲基化圖譜沒有差異。
胚胎發(fā)育
 
果實成熟
 
肌肉發(fā)育

(2)CG/CHG/CHH甲基化水平分布
  • 不同物種中,甲基化修飾可能傾向于發(fā)生在不同類型的C位點上,該分析有助于反應甲基化發(fā)生位點類型的偏好性。
  • 甲基化水平分布的組間比較,能夠更進一步了解組間甲基化水平的變化。
  • 不同基因組元件(CGI相關(guān)元件、重復序列元件、基因元件等)的甲基化水平分布規(guī)律不同。特別是在不同物種中,基因元件的甲基化水平可能有一定的特點。
  • 比較特定元件甲基化水平的組間差異也能發(fā)現(xiàn)潛在的功能差異。
單樣本三類甲基化水平分布
 

組間CpG甲基化水平分布比較

 
CGI相關(guān)元件
 
各類重復序列元件
 

基因元件


(3)降維分析
降維分析嘗試找到最能反映數(shù)據(jù)點真實分布情況的兩個維度,以方便對數(shù)據(jù)進行直觀把握。一般采用共同覆蓋的5×以上位點進行分析:
  • 主成分分析(PCA)
  • 非度量多維標度法(NMDS)
  • 主坐標分析(PCoA)

PCA可采用統(tǒng)計檢驗分析組間差異的顯著性:
ü  相似性分析(ANOSIM)
ü  置換多元方差分析(ADONIS)

 
NMDS
 
PCoA


(4)聚類分析
  • 聚類分析考慮的是各樣本之間的距離,即不相似性。一般采用共同覆蓋的5×以上位點進行分析。
  • 與降維分析的差別在于,聚類分析更真實地反映樣本的差距,而非僅考慮兩個代表性維度。

(5)相關(guān)性分析
  • 相關(guān)性分析考慮的是各樣本之間的相似性。一般采用共同覆蓋的5×以上位點進行分析。
  • 一般采用皮爾森相關(guān)系數(shù)
 
二、差異甲基化位點/區(qū)域分析DMC/DMR分析)
(1)DMC/DMR鑒定
  • 差異甲基化位點:DMC
  • 差異甲基化區(qū)域:DMR
(甲基化位點一般是與附近的位點一起起作用的)
ü  鑒定實驗組與對照組甲基化圖譜的具體差異。
ü  如果實驗設(shè)計包括多個時間節(jié)點,也可以比較相鄰時間節(jié)點/感興趣的時間節(jié)點之間的甲基化圖譜的差異。
DMC在基因組上的分布
 
DMR在基因組上的分布

(2)DMC/DMR轉(zhuǎn)錄因子結(jié)合分析(TF binding motif )
主要關(guān)注Promoter和Enhancer等調(diào)控區(qū)域DMC/DMR的TF結(jié)合位點。

 
3)時序甲基化數(shù)據(jù)的分析策略(Time Course)
比較相鄰時間點的差異
直接篩選時間階段相關(guān)的DMC和DMR
ü  線性模型/混合線性模型
  (可以排除混雜因素干擾,如性別)
共甲基化模式分析(階段特異性Cluster篩選)
ü  WGCNA(權(quán)重基因共表達網(wǎng)絡(luò)分析)
ü  MEGENA(多尺度嵌入式基因共表達網(wǎng)絡(luò)分析)
ü  mfuzz
ü  ... ...

 

(4)DMC/DMR在基因元件上的分布
  • TE(轉(zhuǎn)座元件):影響基因組穩(wěn)定性        
  • Promoter:影響基因表達
  • Genebody

(5)差異甲基化基因集(DMGs)的功能分析
分析策略:
  • 可以分為Hyper-DMG和Hypo-DMG
  • 可以分為Promoter-DMG和Genebody-DMG
  • Gene Ontology
  • KEGG pathway
  • Reactome pathway
  • DisGeNET disease
  • Disease Ontology

三、組學關(guān)聯(lián)分析:甲基化組學&轉(zhuǎn)錄組學
(1)Meta genes整體關(guān)聯(lián)
  • 同一樣本/組別內(nèi),所有基因的表達水平與對應基因的甲基化水平進行關(guān)聯(lián)。
  • 研究的是基因甲基化與表達的整體關(guān)系。
TSS位點附近負相關(guān)
Genebody區(qū)正相關(guān)
整體負相關(guān)

(2)DMG-DEG對應關(guān)聯(lián)
  • 重疊分析:
特點:簡單粗暴,也適用于樣本量少的情況。
分析結(jié)果:韋恩圖。
  • 皮爾森/斯皮爾曼相關(guān)性分析
特點:準確計算相關(guān)性程度(R值),及其顯著性(p值)。
分析結(jié)果:散點圖(+擬合線);相關(guān)性熱圖

 

(3)網(wǎng)絡(luò)關(guān)聯(lián)
基于基因表達具有功能和通路的富集性。有最低樣本數(shù)量要求。
  • 共表達-共甲基化網(wǎng)絡(luò)關(guān)聯(lián):
ü  WGCNA module correlation
ü  EMDN algorithm
  • 融合網(wǎng)絡(luò)關(guān)聯(lián):
ü  SNF algorithm
以上就是關(guān)于DNA甲基化測序的數(shù)據(jù)挖掘思路分享。
來源:深圳市易基因科技有限公司
聯(lián)系電話:0755-28317900
E-mail:wuhuanhuan@e-gene.cn

用戶名: 密碼: 匿名 快速注冊 忘記密碼
評論只代表網(wǎng)友觀點,不代表本站觀點。 請輸入驗證碼: 8795
Copyright(C) 1998-2024 生物器材網(wǎng) 電話:021-64166852;13621656896 E-mail:info@bio-equip.com