無論所使用的real-time PCR是何種型號,正確的數(shù)據(jù)分析對于獲得有效的實驗結(jié)果都是至關(guān)重要的。這里介紹有關(guān)real-time PCR數(shù)據(jù)分析的知識。
在討論基本分析過程之前,先介紹如何設(shè)計一個好的實驗。如果你是自己設(shè)計的引物和探針,那有助于下一步的工作。但是在有些情況下,人們使用出版文獻(xiàn)上的序列會更方便。記住,即便是出版物提供的序列也不能保證會得到優(yōu)化的實驗結(jié)果。而且排版錯誤的可能性也需要考慮在內(nèi)。所以進(jìn)入實驗室之前使用BLAST對全部序列進(jìn)行核實確保他們是正確的。下訂單前先檢察引物和探針的序列和Tm值是實驗設(shè)計的基本要求。
標(biāo)準(zhǔn)曲線是判斷實驗質(zhì)量的重要手段。使用一個已知的模板,PCR產(chǎn)物,合成的寡核苷酸或轉(zhuǎn)錄的RNA做個標(biāo)準(zhǔn)曲線能夠確定PCR的效率,敏感性,動態(tài)范圍和其他的參數(shù)。建立標(biāo)準(zhǔn)曲線時使用OD260的模板樣本。模板的總量以DNA分子的數(shù)量來描述,把質(zhì)量轉(zhuǎn)化為DNA含量的公式如下:
(質(zhì)量(克)*阿伏伽德羅常數(shù))每個堿基的平均質(zhì)量*模板的長度。
例如,合成70-mer的單鏈DNA,樣本質(zhì)量為0.8*10ˆ-11gm。代入公式得:
(0.8*10ˆ-11*6.023*10ˆ23molecules/mole)330gm/mole/base*70 base。
如果使用雙鏈的模板,則堿基的平均質(zhì)量為660gm/mole/base。
標(biāo)準(zhǔn)曲線使用的模板含量從1*10ˆ7開始連續(xù)稀釋7次每次稀釋10倍,最終得到10個模板拷貝。這樣的濃度有助于得到最高的ΔRn和最低的Ct。用Excel畫曲線時以模板數(shù)量的對數(shù)值為X,Ct(cycle threshold)值為Y軸。標(biāo)準(zhǔn)曲線的計算公式如下:
y=mx+b。y就是Ct,m是斜率,x=log10template amount,b=y-intercept。
用斜率計算出實驗效率Efficiency【10ˆ(-1/斜率)】-1。實驗效率告訴我們PCR反應(yīng)的執(zhí)行情況。鑒定系數(shù)rˆ2是實際結(jié)果和理論值相符程度,表示稀釋和移液的準(zhǔn)確性。y-intercept說明實驗的敏感度和模板含量的精確度。
通過已知的模板含量,可以計算合成一定的DNA含量需要多少次循環(huán):
n=Log(Nn)-Log(N0)/Log(1+E)
Nn是n次循環(huán)后的模板含量,N0是原來的模板含量,E是實驗效率Efficiency,n是所需的循環(huán)數(shù)。
一個完美實驗的斜率是-3.32,效率Efficiency是100%,y-intercept在33到37次循環(huán)之間,r^2是1.00。如果效率(Efficiency)較低,y-intercept較高,這意味著循環(huán)開始時DNA的含量不足或需要多跑幾個循環(huán)?梢越邮苄蔈fficiency在95-100%之間的實驗結(jié)果,但如果y-intercept大大高于37或低于33,這說明沒有準(zhǔn)確的查明樣本數(shù)量。通常偏高的y-intercept值是以低濃度存儲,反復(fù)冷凍解凍造成樣本變性的結(jié)果。以標(biāo)準(zhǔn)曲線證實實驗有效后,就能把同樣的規(guī)范用于cDNA或RNA來優(yōu)化樣本準(zhǔn)備。
設(shè)備運(yùn)行后的數(shù)據(jù)分析建議按照以下的步驟進(jìn)行。
1. Amplification curves。
如果沒有這個曲線或看上去不正常,一定要查明原因解決問題。首先應(yīng)檢查染色層(dye layer)和指定的reporter,看似簡單的方法確是最有可能的解釋。如果曲線看上去很不規(guī)則,可能是樣本中沒有熒光劑,或者是加樣口根本沒有樣本。具體是那種情況大約在40次循環(huán)后就可以判明,解決方法是調(diào)節(jié)設(shè)備放棄那些無用的加樣口,使曲線得以連貫。
2. Baseline
所有的real-time PCR都用基線(Baseline)在早先的幾次循環(huán)時來檢測背景噪音和熒光劑里的試劑。這樣不完整的弧線出現(xiàn)在正式的讀出數(shù)據(jù)之前,大約在第1個到第10個循環(huán)之間。如果Ct的最低值小于基線的上限,應(yīng)該調(diào)整基線值。通常設(shè)置2-3個循環(huán)基線的上限低于Ct最低值。判斷基線設(shè)置是否合適可以觀察增擴(kuò)曲線(amplification curve)Y軸(ΔRn)的線性表達(dá)而不是對數(shù)方式,有時對數(shù)曲線上看似較好的趨勢在線性圖上則能反映出問題。如果上限過高,會出現(xiàn)在基線之下很低的Ct。調(diào)節(jié)基線直到曲線的直線部分與基線相仿。正確的調(diào)節(jié)會使得彩虹狀殘缺的對數(shù)曲線消失。同樣地,極限的上限可能會過低,也可以觀察線性增擴(kuò)曲線來了解。調(diào)節(jié)基線的影響主要在于低Ct的樣本或高含量的模板,如果必須重復(fù)試驗,稀釋模板2倍就相當(dāng)于把Ct系數(shù)改變1。
下一步的重點(diǎn)在設(shè)置正確的閾值。當(dāng)所有增擴(kuò)標(biāo)定點(diǎn)處于指數(shù)級增長階段,用對數(shù)值顯示Y軸。不太可能設(shè)置閾值能適合所有的曲線,一個實驗里采用多種閾值只適用于mRNA含量低造成ΔRn非常低的情況。有人認(rèn)為閾值盡可能比較好,有些分析軟件調(diào)整閾值造成標(biāo)準(zhǔn)曲線有很高的R^2。還有人認(rèn)為最精確的Ct來源于選擇SDM最大的曲率。其實并沒有最佳的閾值,設(shè)置低造成低Ct也許有益于某些情況。樣本含量上2倍的差異帶來Ct值1倍的變化,對效率(efficiency)的影響接近100%。
3. 污染控制(No template controls,NTC)
確保測試的是樣本為不是污染物,建議在正式樣本前的加樣孔中加入2-3個無模板對照樣本。加入正式樣本前先封閉對照組,同樣準(zhǔn)備2-3對照樣本在加樣完成后加入。這個步驟能發(fā)現(xiàn)樣本是否被污染及其程度。NTC顯示Ct值低于40,可以檢查增擴(kuò)曲線來了解詳情。如果曲線平穩(wěn)的增加不存在指數(shù)級的提高,或增擴(kuò)速度很慢,用線性圖觀察ΔRn圖形。一種情況是下降的ROX同時FAM不變。另一種是FAM上升但ROX不變。使用多重試圖檢查每個加樣孔的所有熒光試劑,搞清楚報告的信號和有關(guān)染料的關(guān)系。如果是輕度污染,可以調(diào)節(jié)閾值來消除影響或移除有關(guān)的加樣孔。如果NTC出現(xiàn)指數(shù)級增擴(kuò),會是先前實驗留下的PCR產(chǎn)物造成的。處理方法:用dUTP (2’deoxyurindine 5’triphosphate)和酶UNG(uracil-N-glycosylase)替換dTTP。
4. 無逆轉(zhuǎn)錄控制(No reverse transcription control)
如果real-time PCR用于mRNA定量分析,需要評估樣本中染色體污染物的總量。加入一個不含逆轉(zhuǎn)錄酶的樣本(-RT)。如果-RT的結(jié)果是陽性的,可以用DNase處理樣本去掉主要的污染物但會減低RNA的產(chǎn)量,或設(shè)計引物/探針跨基因間區(qū),或一直使用逆轉(zhuǎn)錄控制。
陽性控制
陽性控制最好的方法是標(biāo)準(zhǔn)曲線。用它來做量化分析,斜率和y-intercept反映了實驗質(zhì)量。如果不能使用一條人工標(biāo)準(zhǔn)曲線,一條覆蓋小段DNA或全長RNA的標(biāo)準(zhǔn)曲線能反映出實驗的效率。如果實驗沒有增擴(kuò)效果,把注意力放在試劑和模板可能存在的問題上。
5. 實驗樣本
不同廠商的探針會有不同的表現(xiàn)和不同的最大ΔRn值,這個差別能從實質(zhì)上影響ΔRn。但它們不會妨礙指數(shù)級增擴(kuò),只要增擴(kuò)期間在設(shè)置好閾值相關(guān)數(shù)據(jù)就可用于分析工作。
有可能出現(xiàn)當(dāng)ROX平穩(wěn)下降,一些曲線在指數(shù)級增擴(kuò)前是平行的狀況。還有可能看似存在增擴(kuò)的曲線其實是假的。分析軟件會盡其所能處理數(shù)據(jù),然而如果ΔRn大大的低于1,應(yīng)該直接懷疑沒有真正的增擴(kuò)存在無論曲線看上去如何。
6. CV(coefficient of variance)
CV(coefficient of variance)是標(biāo)準(zhǔn)偏差除以算數(shù)平均,用來測量實驗內(nèi)的再現(xiàn)性和實驗的變化。如果CV值較小對實驗沒有影響。如果一個加樣口的值明顯不同于其他的,重復(fù)后的實驗任然出現(xiàn)這樣的結(jié)果,使用多成分窗口(multicomponent view)或光譜窗口(raw spectra)檢查增擴(kuò)情況。如確實沒增擴(kuò)就需檢查是否加入了探針熒光劑,也要可能缺少了探針。排除了探針的可能性后再檢查是否加入了模板。如果異常加樣口的Ct較低,可能模板被加了2次。重復(fù)加入模板只會降低Ct 1,如果CV值大,這個想象不會被發(fā)覺。另一個推測是容器沒有很好的密封,一些加樣口或試管里的試劑蒸發(fā)了。
7. 定量數(shù)據(jù)
完成初步的實驗和分析后,下一步要決定如何有意義地比對數(shù)據(jù)。量化mRNA和DNA的標(biāo)準(zhǔn)曲線有時作為絕對量化的參考。標(biāo)準(zhǔn)曲線允許在質(zhì)量基礎(chǔ)上計算總量未知的樣本,但是無論材料濃度的精確性如何,最終結(jié)果是相對于一個單位的定義。大部分設(shè)備的軟件可以按事先指定的單位計算總量,也可按以下的公式:
Log10 copy number = Ct–y-intercept/slope。
重要的是檢驗?zāi)愕脑噭┠軌蚪o出100%的反應(yīng)效率。沒必要指望你的樣本里會有一個能給出精確的基因表達(dá)測量。有關(guān)規(guī)范化和相對量化的內(nèi)容本文不做展開討論。
8. 數(shù)據(jù)統(tǒng)計
實驗完成了,數(shù)據(jù)也分析了,還有什么可做的?還有很多,real-time PCR統(tǒng)計與大量參數(shù)有關(guān),如實驗過程中的細(xì)胞收獲,核苷酸,提取技術(shù),逆轉(zhuǎn)錄,PCR條件和試劑等情況。使用你的數(shù)據(jù)之前有必要先進(jìn)行統(tǒng)計整理。數(shù)據(jù)的表達(dá)取決于實驗的目的,如測試受某因素影響前和后的基因表達(dá),正常細(xì)胞對比癌癥細(xì)胞,時間的影響等等。另一類如食物、水、環(huán)境中的微生物含量,確認(rèn)生物芯片、siRNA的結(jié)果等等。
根據(jù)實驗的類型,有關(guān)數(shù)據(jù)應(yīng)該按一定的原則整理有助于讀者觀察到變化,包括數(shù)據(jù)含義,標(biāo)準(zhǔn)差,置信區(qū)間。有些統(tǒng)計用于告訴讀者存在重大差異的可能性,大多數(shù)real-time PCR是檢驗假設(shè)的結(jié)果,有時這些差異很明顯統(tǒng)計步驟只是走過場。但是生物系統(tǒng)是不斷變化的,不精確的,有時統(tǒng)計能說明數(shù)據(jù)的排他性。