蛋白質(zhì)組學基礎:快速理解DDA與DIA的方法
瀏覽次數(shù):881 發(fā)布日期:2024-8-22
來源:本站 僅供參考,謝絕轉(zhuǎn)載,否則責任自負
基于質(zhì)譜(MS)的蛋白質(zhì)組學實現(xiàn)了生物樣本中蛋白質(zhì)表達譜的定性定量分析,并且可以輔助研究各種不同狀態(tài)下蛋白的相互作用。典型的自下而上的蛋白質(zhì)組學工作流程(圖1)包括幾個主要步驟:(i) 從所研究的生物樣品中提取蛋白質(zhì)混合物,(ii) 對分離的蛋白質(zhì)濃度進行測定,(iii) 通過凝膠電泳或液相色譜法對蛋白質(zhì)進行分離(可選),(iv) 蛋白質(zhì)酶切, (v) 質(zhì)譜檢測,(vi) 數(shù)據(jù)庫搜索蛋白質(zhì)鑒定。
圖1 自下而上的蛋白質(zhì)組學流程[1]
近年來,許多質(zhì)譜方法從數(shù)據(jù)依賴采集(DDA)過渡到數(shù)據(jù)非依賴采集(DIA)。雖然DIA靈敏度和覆蓋度高,但并不是所有的研究都適合,很多情況下DDA反而更合適。對于很多初涉質(zhì)譜蛋白質(zhì)組學領(lǐng)域的研究者來說,往往對DDA和DIA的方法難以理解,因此,本期推送我們給大家詳細介紹一下這兩種不同的質(zhì)譜采集方法。
首先,我們要對質(zhì)譜采集信號的過程有個簡單的概念。簡言之,我們的肽段在經(jīng)過液相(LC)洗脫之后,被電離霧化成為帶電離子(即母離子,precursor)進入質(zhì)譜內(nèi)部,首先經(jīng)過一級母離子的全掃描(即survey scan),得到MS1譜圖,然后針對這些掃描到的母離子,選擇哪些離子去做下一步的MS2碎裂和掃描,就涉及了DDA還是DIA的問題。
DDA
DDA是Data Dependent Acquisition的縮寫,即數(shù)據(jù)依賴采集,指的是在一個循環(huán)內(nèi),選取離子強度Top N的MS1母離子進行MS2碎裂與掃描(原理示意見圖2),N在質(zhì)譜采集方法中進行設定,一般為10-20。隨著肽段流出,完成整個液相梯度內(nèi)的譜圖采集,產(chǎn)生的下機數(shù)據(jù)隨后采用相應的軟件完成肽段和蛋白的鑒定和定量。
圖2 DDA譜圖采集示意圖
DDA是質(zhì)譜采集方法的一種大類,與不同的實驗方法結(jié)合,又可以產(chǎn)生不同的數(shù)據(jù)類型,滿足不同的實驗需求,包括常規(guī)的定性、非標記定量(LFQ)、標記定量(TMT/SILAC等)。
DDA的優(yōu)勢在于實驗方法簡單,其譜圖的復雜性較低,不僅可以進行標準的搜庫分析,還可以進行l(wèi)arge search space搜索,如PTM search、酶切半特異性及非特異性搜索,甚至開放搜索。針對未知樣本,則需要進行從頭測序(de novo)分析。DDA的局限性在于檢測動態(tài)范圍有限,易損失低豐度的離子,從而產(chǎn)生較多的定量缺失值,導致重現(xiàn)性不穩(wěn)定,對于復雜樣本的全蛋白組鑒定深度不夠。
針對DDA數(shù)據(jù),PEAKS®軟件既可以針對未知樣本單獨進行從頭測序分析,也可以進行de novo輔助的搜庫分析(DB search),以及非標記定量和各種標記定量分析。此外,PEAKS®還整合了獨有的免疫肽組分析、未知翻譯后修飾及突變位點檢索、完整糖肽鑒定(Studio Only)(圖3),滿足絕大部分DDA數(shù)據(jù)的定性、定量分析需求。
圖3 PEAKS®軟件DDA分析工作流
DIA
DIA的全稱是Data Independent Acquisition,即數(shù)據(jù)非依賴采集,另一種說法為sequential window Acquisition of All Theoretical Fragment ions(SWATH),簡單理解就是二級的采集不依賴一級信號離子的選擇,而是把MS1所有掃描到的母離子按照m/z劃分為若干個小的窗口,對每個窗口內(nèi)的所有母離子進行二級碎裂和掃描,可以認為是無差別“攻擊”(原理示意見圖4)。
圖4 DIA譜圖采集示意圖
DIA的譜圖復雜度要遠遠高于DDA,因此在DIA方法開發(fā)的初期,數(shù)據(jù)分析基本上依賴于譜圖庫搜索(Spectral library)的方法,即要事先通過多組份分餾的方法將所有待分析樣本的混合物進行高pH液相色譜分離,然后通過DDA的采集方法獲得建庫數(shù)據(jù),使用建庫數(shù)據(jù)的鑒定結(jié)果作為譜圖庫,然后進行DIA數(shù)據(jù)的定性和定量分析。譜圖庫搜索速度快、準確性高,但也存在一些局限,比如建庫深度不夠,建庫需要額外的樣品消耗、成本和機時等。隨著譜圖解析算法的發(fā)展,針對DIA的數(shù)據(jù)使用理論參考序列庫進行直接解譜已經(jīng)得到了廣泛應用,深度學習模型的引入,大大提高了DIA直接數(shù)據(jù)庫搜索的譜圖解析率和準確性,也使得DIA de novo分析成為可能[2]。
DIA的優(yōu)勢在于對樣本中所有多肽的無偏檢測,檢測動態(tài)范圍廣,突破了DDA對低豐度樣本檢測的局限,非常適合大規(guī)模、微量樣本的蛋白質(zhì)組學研究。但DIA對質(zhì)譜硬件和軟件的要求比DDA更高,綜合成本相應就有所增加,此外存在很多翻譯后修飾,也會導致譜圖更加復雜。
PEAKS®軟件支持DIA數(shù)據(jù)的譜圖庫搜索(Spectral Library search)、直接數(shù)據(jù)庫搜索(direct DB search)、DIA數(shù)據(jù)的從頭測序(DIA de novo)分析之外,還獨有DIA免疫肽組的定性定量分析功能,也支持hybrid-DIA數(shù)據(jù)分析(圖5)。
圖5 PEAKS®軟件DIA數(shù)據(jù)分析工作流
DDA or DIA, that is the question.
作為質(zhì)譜蛋白質(zhì)組學研究的兩大類方法,DDA和DIA各有優(yōu)缺點,并沒有絕對的好壞之分,適合的才是最好的。DIA更加適合進行需要高覆蓋率和定量準確性的大規(guī)模蛋白質(zhì)組學研究。Rebecca C. Poulos等 (2020) [3]將卵巢癌組織、前列腺癌組織和酵母蛋白按照不同比例混合,以HEK293T細胞蛋白作為對照,歷時4個月,在6臺質(zhì)譜儀上共采集了1560針DIA數(shù)據(jù),期間還穿插了5000多針其他樣品的數(shù)據(jù)采集。數(shù)據(jù)分析結(jié)果顯示,在短時間內(nèi)獲得的DIA-MS數(shù)據(jù)重現(xiàn)性和定量準確性均較高,但隨著采集間隔時間的延長和儀器性能的變化,CV值會累積增加,因此對于大隊列、長時間的數(shù)據(jù)采集,仍需要開發(fā)合適的歸一化校正方法。
(Rebecca C. Poulos等,2020)
DDA 更加適合需要高靈敏度和準確性的小規(guī)模研究,尤其是對于純化蛋白、翻譯后修飾組學的研究。此外,DDA可搭配各種不同的標記實驗方法,提升定量的穩(wěn)定性。Matthias Mann等 (2023)[4]使用DDA 分析了小鼠心臟、骨骼肌等7種組織線粒體的全蛋白組和磷酸化蛋白組,共鑒定到1266個線粒體蛋白,超過MitoCarta 3.0數(shù)據(jù)庫中的92%,且定量CV小于20%。線粒體磷酸化蛋白質(zhì)組表現(xiàn)出廣泛的線粒體內(nèi)磷酸化,且與融合和裂變的組織特異性調(diào)節(jié)有關(guān)。該研究是 DDA 對細胞器蛋白質(zhì)組及磷酸化修飾高靈敏鑒定的典型示例。
(Matthias Mann等,2023)
劃重點
- Dupree, E.J.; Jayathirtha, M.; Yorkey, H.; Mihasan, M.; Petre, B.A.; Darie, C.C. A Critical Review of Bottom-Up Proteomics: The Good, the Bad, and the Future of This Field. Proteomes 2020, 8, 14. https://doi.org/10.3390/proteomes8030014
- Tran, N.H., Qiao, R., Xin, L. et al. Deep learning enables de novo peptide sequencing from data-independent-acquisition mass spectrometry. Nat Methods 16, 63–66 (2019). https://doi.org/10.1038/s41592-018-0260-3
- Poulos, R.C., Hains, P.G., Shah, R. et al. Strategies to enable large-scale proteomics for reproducible research. Nat Commun 11, 3793 (2020). https://doi.org/10.1038/s41467-020-17641-3
- Hansen, F. M., Kremer, L. S., Karayel, O., Bludau, I., Larsson, N.-G., Kühl, I., & Mann, M. (2024). Mitochondrial phosphoproteomes are functionally specialized across tissues. Life Science Alliance, 7(2), e202302147. doi:10.26508/lsa.202302147
-掃碼關(guān)注-
www.bioinfor.com (EN)
www.deepproteomics.cn(CN)
作為生物信息學的領(lǐng)軍企業(yè),BSI專注于蛋白質(zhì)組學和生物藥領(lǐng)域,通過機器學習和先進算法提供世界領(lǐng)先的質(zhì)譜數(shù)據(jù)分析軟件和蛋白質(zhì)組學服務解決方案,以推進生物學研究和藥物發(fā)現(xiàn)。我們通過基于AI的計算方案,為您提供對蛋白質(zhì)組學、基因組學和醫(yī)學的卓越洞見。旗下著名的PEAKS系列軟件在全世界擁有數(shù)千家學術(shù)和工業(yè)用戶,包括:PEAKS Studio,PEAKS Online,PEAKS GlycanFinder, PEAKS AB及抗體綜合表征服務等。
聯(lián)系方式:021-60919891;sales-china@bioinfor.com