一、差異基因篩選
首先對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理和均一化處理。沒有重復(fù)的數(shù)據(jù)采用倍數(shù)法和 Z 值法相結(jié)合的方法來進(jìn)行差異基因的篩選,挑選出至少在一個(gè)樣本里表達(dá)倍數(shù)大于 two fold及 Z 的絕對(duì)值大于 2(即 Z>2 或 Z<-2)的基因挑出。對(duì)于有重復(fù)實(shí)驗(yàn)的芯片數(shù)據(jù)則采用統(tǒng)計(jì)方法來進(jìn)行差異基因的篩選。
針對(duì)多芯片結(jié)果進(jìn)行了芯片間及差異表達(dá)基因之間的雙向聚類,同時(shí)對(duì)新基因的功能進(jìn)行預(yù)測,目的是對(duì)不同的樣本進(jìn)行分類,并對(duì)差異基因進(jìn)行相似性分析。聚類方法包括層次聚類,K-means聚類及SOM等。
對(duì)差異基因進(jìn)行相應(yīng)的生物學(xué)功能分類,采用GO 數(shù)據(jù)庫中的功能聚類注釋結(jié)果,并根據(jù)統(tǒng)計(jì)檢驗(yàn)方法(P-value)篩選顯著顯異的分類。最后針對(duì)客戶的需求進(jìn)行結(jié)果的輸出。
建立信號(hào)通路和生物功能網(wǎng)絡(luò),將差異基因與相關(guān)的信號(hào)通路進(jìn)行比較、整合,找出基因之間的相互關(guān)系,進(jìn)行通路動(dòng)態(tài)仿真。并根據(jù)統(tǒng)計(jì)檢驗(yàn)方法(P-value)篩選顯著顯異的代謝通路,已期對(duì)致病基因構(gòu)建模擬疾病狀態(tài)的通路網(wǎng)絡(luò),對(duì)目的基因進(jìn)行分析,以期發(fā)現(xiàn)目的基因與疾病之間在生物學(xué)通路或生化途徑上的關(guān)聯(lián)。
Pathway中差異基因的統(tǒng)計(jì)圖
差異基因在代謝途徑上的分析情況,紅色標(biāo)記上調(diào)基因,綠色標(biāo)記下調(diào)基因
利用相關(guān)的轉(zhuǎn)錄因子(TF)數(shù)據(jù)庫,采用pwmatch算法對(duì)每個(gè)轉(zhuǎn)錄因子分析其在差異基因中的分布情況,利用chi-square test等統(tǒng)計(jì)方法尋找有差異的轉(zhuǎn)錄因子。目的在于找到調(diào)控目標(biāo)生物性狀,統(tǒng)計(jì)學(xué)上有顯著差別的轉(zhuǎn)錄因子。
對(duì)差異基因進(jìn)行Co-expression基因調(diào)控網(wǎng)絡(luò)的構(gòu)建。采用貝葉斯方法,通過對(duì)表達(dá)數(shù)據(jù)進(jìn)行機(jī)器學(xué)習(xí),來構(gòu)建差異基因之間的動(dòng)態(tài)網(wǎng)絡(luò)。這是一種數(shù)據(jù)驅(qū)動(dòng)的網(wǎng)絡(luò)構(gòu)建,可以發(fā)現(xiàn)一些新的調(diào)控關(guān)系。
通過整合PubMed text mining,同源預(yù)測,基因neighbor,蛋白-蛋白相互作用,基因融合等數(shù)據(jù),建立一個(gè)all differentially expressed genes in a single plot的調(diào)控網(wǎng)絡(luò)。這是一種已有知識(shí)驅(qū)動(dòng)的網(wǎng)絡(luò)構(gòu)建。目的在于對(duì)前人的研究結(jié)果和本實(shí)驗(yàn)的生物信息進(jìn)行關(guān)聯(lián)分析,以期找到一些新的基因共表達(dá)的線索,發(fā)現(xiàn)新的規(guī)律。
主要是針對(duì)復(fù)雜的疾病,利用芯片數(shù)據(jù)對(duì)這些疾病的子類型進(jìn)行區(qū)分,識(shí)別傳統(tǒng)診斷手段無法辨別,但對(duì)預(yù)后卻有重要意義的亞型。
利用Bayesian network, PAM及SVM等機(jī)器學(xué)習(xí)語言對(duì)芯片結(jié)果進(jìn)行預(yù)測模型的構(gòu)建,將部分芯片數(shù)據(jù)拿來做預(yù)測模型,然后部分芯片數(shù)據(jù)作為測試數(shù)據(jù)集(獨(dú)立樣本)來驗(yàn)證模型的準(zhǔn)確性。目的在于利用實(shí)驗(yàn)數(shù)據(jù)來篩選出一批靶標(biāo)基因,并以此構(gòu)建模型,以進(jìn)行早期診斷、疾病預(yù)測和預(yù)后分析。
應(yīng)用模糊聚類等機(jī)器學(xué)習(xí)方法,對(duì)差異基因進(jìn)行基因表達(dá)趨勢的顯著性分析,篩選出隨著時(shí)間的變化,顯著性的基因表達(dá)趨勢,同時(shí)得到相應(yīng)的目標(biāo)表達(dá)趨勢。對(duì)隨著時(shí)間的深入差異表達(dá)的基因,進(jìn)行基因表達(dá)趨勢分析,篩選出不同處理作用的最重要的基因表達(dá)趨勢。
* 所有解釋權(quán)及版權(quán)歸上海敏芯信息科技有限公司所有,詳情請(qǐng)咨詢021-31523052
bio-equip.com
上海敏芯信息科技有限公司
上海敏芯信息科技有限公司成立于2006年10月,是國內(nèi)知名的生物信息學(xué)服務(wù)提供商。隨著業(yè)務(wù)擴(kuò)展,公司已經(jīng)發(fā)展成為國內(nèi)第一家專業(yè)提供系統(tǒng)生物學(xué)服務(wù)的高科技企業(yè),提供包括基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)相關(guān)的實(shí)驗(yàn)設(shè)計(jì)、實(shí)驗(yàn)檢測、數(shù)據(jù)分析、結(jié)果驗(yàn)證及論文修改的全面解決方案。公司已獲得國家及上海市中小企業(yè)創(chuàng)新基金、上海市科技創(chuàng)新行動(dòng)計(jì)劃、上海市大學(xué)生創(chuàng)業(yè)基金、上海市專利試點(diǎn)企業(yè)、上海市技術(shù)成果轉(zhuǎn)化認(rèn)證、上海市楊浦區(qū)人才資助資金等多項(xiàng)國家及省部級(jí)獎(jiǎng)勵(lì)。
具體業(yè)務(wù)包括:
-基因芯片:表達(dá)譜芯片、miRNA芯片、SNP芯片、甲基化芯片、Exon芯片、Tilling芯片、lncRNA芯片等實(shí)驗(yàn)及數(shù)據(jù)分析
- 高通量測序:miRNA測序、mRNA測序、基因組重測序、甲基化測序、ChIP-Seq等實(shí)驗(yàn)及數(shù)據(jù)分析
-蛋白質(zhì)組學(xué):蛋白質(zhì)芯片(SELDI)、細(xì)胞因子芯片、ITRAQ、Shotgun Proteomics、DIGE-2D等
- 代謝組學(xué):液質(zhì)聯(lián)用(LC-MS)、氣質(zhì)聯(lián)用(GC-MS)及核磁共振(NMR)的實(shí)驗(yàn)及數(shù)據(jù)分析
- 文獻(xiàn)挖掘:提供基于pubmed數(shù)據(jù)庫的關(guān)鍵詞搜索服務(wù)
- 生物信息培訓(xùn):定期舉辦綜合性生物信息培訓(xùn)班,并提供上門培訓(xùn)服務(wù)及隨到隨學(xué)班
u 專利代理:提供生命科學(xué)領(lǐng)域的專利寫作、專利潤色及專利申請(qǐng)服務(wù)
- 實(shí)驗(yàn)服務(wù):引物設(shè)計(jì)、RT-PCR、3730測序、Western Blot、2D-MS等
目前,公司國內(nèi)外客戶已超過500家,合作發(fā)表了50多篇高影響因子的SCI(影響因子累計(jì)超過100分),并參與多項(xiàng)國家科研項(xiàng)目的申請(qǐng)與實(shí)施。