本期為大家介紹一個(gè)開(kāi)放源碼的生物資訊軟件 –Cytoscape,它可以建構(gòu)可視化的分子交互作用網(wǎng)絡(luò),并可將已有的基因表達(dá)信息(gene expression profiles) 整合進(jìn)此網(wǎng)絡(luò)中,輕易觀察分子間 (蛋白質(zhì)—蛋白質(zhì) 或 蛋白質(zhì)—DNA…) 的關(guān)聯(lián)性。
Cytoscape 是 Institute for Systems Biology (Leroy Hood 實(shí)驗(yàn)室)、加州大學(xué)圣地亞哥分校 (Trey Ideker 實(shí)驗(yàn)室)、加州大學(xué)舊金山分校 (Bruce Conklin 實(shí)驗(yàn)室)、Memorial_Sloan-Kettering 癌癥研究中心 (Chris Sander 實(shí)驗(yàn)室)、Pasteur 研究院 (Benno Schwikowski 實(shí)驗(yàn)室) 等研究單位共同合作開(kāi)發(fā)的一個(gè)開(kāi)放源碼的生物信息分析軟件。Cytoscape 的核心即是網(wǎng)絡(luò) (圖一),每個(gè)節(jié)點(diǎn) (node) 是基因、蛋白質(zhì)或分子,而節(jié)點(diǎn)與節(jié)點(diǎn)之間的連接 (edge) 則代表著這些生物分子之間的相互作用 (圖二)。
使用 Cytoscape 案例
我們先舉一些有使用 Cytoscape 的文獻(xiàn)作為例子,讓大家知道它所帶來(lái)的意義為何。Jie Wang1 等人利用華聯(lián)的 HOA 和 HmiOA 芯片產(chǎn)品,于今年發(fā)表了一篇文章,研究是否可以從 mRNA 和 miRNA 基因表現(xiàn)整合的網(wǎng)絡(luò)調(diào)控關(guān)系中找出影響疾病 (有 BSS 癥狀的心絞痛病人) 可能的關(guān)鍵因子(biomarker);實(shí)驗(yàn)結(jié)果發(fā)現(xiàn) 23 個(gè) miRNA 被正向調(diào)控 (up-regulated) 以及 408 個(gè)基因被負(fù)向調(diào)控,作者將這些資料全部丟進(jìn)在線分析網(wǎng)站miRTrail (Laczny2 等人于 2012 年發(fā)表整合 mRNA 和 miRNA 芯片表現(xiàn)分析工具) 進(jìn)行分析, 利用內(nèi)建的 microCosm 預(yù)測(cè) miRNA 對(duì)應(yīng)的標(biāo)的基因 (target genes) 并和 408 基因做交叉比對(duì),發(fā)現(xiàn)交集的基因總共有115個(gè);并依據(jù)預(yù)測(cè)標(biāo)的基因和 408 基因交叉比對(duì)且符合負(fù)向調(diào)控程度較高的基因群,作優(yōu)先選擇的 miRNA 標(biāo)的(前百分之五),從 23 個(gè) miRNA 中挑出了 6 個(gè)(miR-146b-5p, miR-199a-3p, miR-199a-5p, miR-326, miR-423-3p and miR-484)。最后將找到的 115 基因和 6 個(gè) miRNA 繪制成 network (圖三),我們就可以清楚觀察這 6 個(gè) miRNA 和經(jīng)過(guò)芯片實(shí)驗(yàn)驗(yàn)證的基因之間調(diào)控的關(guān)系,找出交互作用頻率高的基因_(尺寸較大的圓圈)。作者最后挑選了miR-146b-5p、miR-199a-5p 以及 TP53、CALR 基因,另外找了一群病人 (包含控制組 15 人、BBS 癥狀的心絞痛疾病 30 人以及非 BSS 癥狀的心絞痛疾病 30 人)做 RT-PCR 驗(yàn)證,也得到一致的結(jié)果,可以當(dāng)成醫(yī)生治療這類病人的重要生物指標(biāo)。
另外,蛋白質(zhì)之間的調(diào)控作用本來(lái)就是 Cytoscape 的分析強(qiáng)項(xiàng),所以為了觀察 115 負(fù)向調(diào)控基因?qū)?yīng)的蛋白質(zhì)之間的交互作用(PPI,Protein-Protein Interaction),作者將 Reactome FI 這個(gè)配件 plug-in 于 Cytoscape 中,將對(duì)應(yīng)的蛋白質(zhì)交互作用,以圖形方式呈現(xiàn)(圖四),也提供后續(xù)蛋白質(zhì)研究做一個(gè)參考。
除了利用顏色觀察表現(xiàn)量的變化,也可以用來(lái)表示其他量化的連續(xù)性數(shù)據(jù);2012 年 Pahl 3 等人的研究中利用 TargetScan、MirTarget2 以及 Pictar 提供的數(shù)據(jù)庫(kù)預(yù)測(cè)實(shí)驗(yàn)有顯著表現(xiàn)差異miRNA 所對(duì)應(yīng)的標(biāo)的基因,并使用 Cytoscape表現(xiàn)之間的相關(guān)性(圖五)。這些預(yù)測(cè)的標(biāo)的基因和 miRNA 也被放入 RNAhybrid version 2.1 程序中仿真計(jì)算 mRNA-miRNA 之間雜交的minimum free energy (△G,kcal/mole),藉此評(píng)估 mRNA-miRNA 之間鍵結(jié)的強(qiáng)度。前提是計(jì)算 minimum free energy 必須于 Ensembl Biomart 取得標(biāo)的基因的 3’UTR 序列,若沒(méi)有對(duì)應(yīng)的序列數(shù)據(jù)將無(wú)法計(jì)算,圖中會(huì)以黑線和黑色圈圈表示。從圖中的四個(gè) miRNA network 中,可以得知 miR-331-3p 擁有最低的 minimum free energy,表示此 miRNA 和對(duì)應(yīng)的標(biāo)的基因之間有較強(qiáng)的親和性;miR-133a 和 miR-133b 因?yàn)樾蛄邢嗨扑詫?duì)應(yīng)到大部分重復(fù)的標(biāo)的基因,但由于兩者之間差了兩個(gè) base pair,導(dǎo)致和基因之間的親和性不同。作者也進(jìn)一步找出圖中可能的潛在標(biāo)的基因,例如:CSRNP1、SLC7AB、PLK3、FURIN 同時(shí)是 miR-133a、miR-133b、miR-331-3p 的預(yù)測(cè) target genes;DNM2、DNAJB1、TGFBR1、TGOLN2、BCL11A、EDEM1、SFXN2、YTHDF3 八個(gè)基因同時(shí)是miR-204、miR-133a、miR-133b 的預(yù)測(cè)標(biāo)的基因, 而Hypermethy- lated_in cancer 2 (HIC2) gene 則是唯一被四個(gè) miRNA 同時(shí)所預(yù)測(cè)的標(biāo)的基因;它屬于 HIC1 家族基因,極可能是重要的腫瘤抑制基因。
如何使用 Cytoscape
要完成一個(gè) Cytoscape 的網(wǎng)絡(luò)分析,基本上有 4 個(gè)步驟:(搭配影片教學(xué),事半功倍!)
1. Create a network
2. Import a attribute / expression profile
3. Filtering & editing
4. Annotation & data analysis
步驟 1,要先有一個(gè)網(wǎng)絡(luò),可以是從已知的數(shù)據(jù)庫(kù)中取得某個(gè)特定的網(wǎng)絡(luò),例如有 TP53 參與的基因網(wǎng)絡(luò)、Apoptosis pathway 基因網(wǎng)絡(luò)…,或可自行建立,而后續(xù)的動(dòng)作則會(huì)架構(gòu)在此網(wǎng)絡(luò)上進(jìn)行分析;步驟 2,加載想要分析的屬性數(shù)據(jù),亦或是使用華聯(lián)芯片服務(wù)得到的 gene expression profile (fold change、p-value…);步驟 3,由于加載的數(shù)據(jù)往往是很龐大的,要利用篩選、編輯,變成想要的信息;步驟 4,最后可利用此結(jié)果再進(jìn)行后續(xù)的批注或分析。
小結(jié)
Cytoscape 源自系統(tǒng)生物學(xué),用于將生物分子交互網(wǎng)絡(luò)與高通量基因表達(dá)數(shù)據(jù)和其他的分子狀態(tài)信息整合在一起。其最強(qiáng)大的功能在于大規(guī)模蛋白質(zhì)與蛋白質(zhì)相互作用、蛋白質(zhì)-DNA或遺傳分子交互作用的分析。Cytoscape 是開(kāi)放源碼的軟件,任何人都可依自己的需求作修改,或是 Plug-in 后,修改成自己想要的形式,若有厲害的程序開(kāi)發(fā)高手,亦可快速建構(gòu)出新的功能。各位在使用上若有任何問(wèn)題,都?xì)g迎與我們討論。
另外,帶來(lái)一個(gè)好消息:華聯(lián) 2013 最新力作,累積 6 年服務(wù)經(jīng)驗(yàn)深蘊(yùn),整合推出 30 項(xiàng)生物信息分析服務(wù) - BiXOneArray,帶給大家從初階到進(jìn)階的全方位分析服務(wù) !
參考資料
(1) Jie Wang et. al. A Systems Biology Approach to Characterize Biomarkers for Blood Stasis Syndrome of Unstable Angina Patients by Integrating MicroRNA and Messenger RNA Expression Profiling. Evidence-Based Complementary and Alternative Medicine (2013) March 29
(2) Laczny C et. al. miRTrail - a comprehensive webserver for analyzing gene and miRNA patterns to enhance the understanding of regulatory mechanisms in diseases. BMC Bioinformatics (2012) 13:36
(3) Matthew C Pahl et. al. MicroRNA expression signature in human abdominal aortic aneurysms. BMC Medical Genomics (2012) 5:25