關(guān)鍵詞
QE HF; DDA; DIA; Hela;蛋白質(zhì)鑒定;定量蛋白質(zhì)組學(xué)
引言
數(shù)據(jù)非依賴性的掃描模式(data-independent acquisition, DIA)是近幾年來發(fā)展的一種新的質(zhì)譜數(shù)據(jù)采集方式[1]。它的理念是用二級碎片離子進(jìn)行蛋白相對/絕對定量。 DIA 掃描模式中,超高分辨質(zhì)譜對特定質(zhì)量范圍內(nèi)的所有母離子進(jìn)行碎裂,采集所有母離子的碎片離子,并快速地依次掃描相鄰的母離子寬口內(nèi)的所有碎片離子。 DIA 的數(shù)據(jù)中包含了所有碎片離子的保留時(shí)間和強(qiáng)度信息。用非常小的質(zhì)量偏差寬口(如 10 ppm)目標(biāo)性地抽提同一肽段的多個(gè)子離子,計(jì)算子離子的強(qiáng)度,就能對該肽段進(jìn)行鑒定和定量。 DIA 定量相比傳統(tǒng)的基于母離子強(qiáng)度的 DDA 定量有選擇性好,定量準(zhǔn)確等優(yōu)點(diǎn)[1],所以 DIA 成為定量蛋白組學(xué)新的發(fā)展方向。
Q Exactive HF 是賽默飛世爾科技在 2014 年的 ASMS 上推出的全新靜電場軌道阱超高分辨質(zhì)譜儀(圖 1)[2,3]。 Q Exactive HF 采用了分段式四極桿技術(shù)(Advanced Quadrupole Technology, AQT)使離子傳輸效率至少提高了 2 倍;超高場 Orbitrap 技術(shù),提高了Orbitrap 掃描速度,在 15000 分辨率時(shí),二級譜圖的掃描速度是20 Hz。這兩項(xiàng)技術(shù)提高了 QE HF 進(jìn)行 DDA、 DIA 數(shù)據(jù)的采集能力。本文用 1 小時(shí)快速色譜梯度對 QE HF 的 DDA 鑒定能力和 DIA定量能力進(jìn)行考察,同時(shí)從定量肽段數(shù)目和 CV 兩方面對 DDA 定量和 DIA 定量能力進(jìn)行比較。
實(shí)驗(yàn)條件
實(shí)驗(yàn)材料和方法
Pierce HeLa Protein Digest Standard(貨號: 88329),稀釋至500 ng/µl, EASY-nLC 進(jìn)樣 1µl, 500 ng進(jìn)行 DDA、 DIA 數(shù)據(jù)采集,每種采集模式重復(fù) 3 遍。
高效液相色譜分離
高效液相色譜儀: EASY-nLC 1000 (Thermo ScientificTM)
分析柱:實(shí)驗(yàn)室自制 C18, 15 cm, ID 75 µm, 3 µm
流動相: A: 0.1% 甲酸水溶液; B: 0.1% 甲酸乙腈溶液
梯度: 60 min, 3/0 – 6/2 – 22/48 – 40/53 – 80/55 – 80/60(%B/min)
流速: 300 nL/min
質(zhì)譜分析
DDA 數(shù)據(jù)采集:
質(zhì)譜儀: Q Exactive HF (Thermo ScientificTM);
離子源: NanoFlex 離子源;離子模式:正離子;
噴霧電壓: 1.8 kV;毛細(xì)管溫度: 275° C; S-Lens RF: 55%;
分辨率:一級 120000@m/z 200,二級 15000@m/z 200;一級
AGC: 3e6, Maximum IT: 50ms;
碰撞能量: NCE 27%; Fixed first mass: 110 m/z
DIA數(shù)據(jù)采集:
質(zhì)譜儀: Q Exactive HF (Thermo ScientificTM);
離子源: NanoFlex 離子源;離子模式:正離子;
噴霧電壓: 1.8 kV;毛細(xì)管溫度: 275℃; S-Lens RF: 55%;
目標(biāo) m/z 窗口: 400–1000; isolation window: 12Da;
碰撞能量: 27%; fixed first mass: 200 m/z; AGC target: 1e6;
Maximum ion injection time: atuo; loop count: 50
數(shù)據(jù)處理
Proteome Discoverer 蛋白鑒定流程:人蛋白數(shù)據(jù)庫(uniprot human_201309),母離子質(zhì)量偏差: 10 ppm;碎片離子質(zhì)量偏差: 0.02 Da;固定修飾:半胱氨酸烷基化(+57.021 Da);動態(tài)修飾:甲硫氨酸氧化(+15.995 Da);天冬酰胺和谷氨酰胺脫氨基化(+0.984 Da);酶: trypsin;漏切位點(diǎn): 2; FDR< 0.01
Skyline DDA、 DIA 蛋白定量流程: DDA 定量用 skyline MS1 filtering 功能,對每個(gè)肽段強(qiáng)度最高的 3 個(gè)母離子同位素峰進(jìn)行抽提, idotp ≥ 0.8; DIA 定量用 skyline DIA 功能,設(shè)置隔離窗口 12 Da,對給個(gè)肽段強(qiáng)度最高的 5 個(gè)子離子進(jìn)行峰抽提, mProphet 打分,控制 FDR < 0.01。
實(shí)驗(yàn)結(jié)果
1. DIA 數(shù)據(jù)采集以及分析流程
圖 1. DDA 定量和 DIA 定量實(shí)驗(yàn)流程
500 ng Hela 細(xì)胞裂解液進(jìn)行 3 次 1 h 梯度 DDA 分析, Proteome Discoverer 1.4 數(shù)據(jù)庫檢索。將鑒定到的蛋白和肽段信息導(dǎo)入 skyline作為候選定量蛋白和肽段。基于母離子的定量用 skyline 中 MS1 filtering 功能對DDA 數(shù)據(jù)進(jìn)行母離子強(qiáng)度抽提。 500 ng Hela 細(xì)胞裂解液進(jìn)行 3 次目標(biāo) m/z 窗口 400–1000,隔離窗口 12 Da 的 DIA 分析。基于二級子離子的定量用 skyline DIA 功能對子離子進(jìn)行峰抽提, mProphet 打分,篩選 Q value < 0.01 的肽段為定量肽段。
在分析 DIA 數(shù)據(jù)之前,需要建立譜圖庫,譜圖庫中包含所有蛋白在質(zhì)譜中鑒定到的肽段,以及肽段的保留時(shí)間、碎片離子質(zhì)荷比、碎片離子強(qiáng)度等信息。數(shù)據(jù)依賴性掃描是最好的建立譜圖庫的數(shù)據(jù)采集方式。 500 ng Hela 細(xì)胞裂解液進(jìn)行三次DDA 數(shù)據(jù)采集。原始數(shù)據(jù)經(jīng) Proteome Discoverer 檢索并控制FDR < 1%。將三次 DDA 鑒定結(jié)果合并,導(dǎo)入 skyline 建立譜圖庫。 DDA 數(shù)據(jù)除了能給出蛋白和肽段的鑒定信息,還能基于母離子的強(qiáng)度/峰面積進(jìn)行定量。 Skyline 中 MS1 filtering 功能對母離子的多個(gè)同位素峰進(jìn)行抽提,并且根據(jù)同位素分布進(jìn)行打分(idotp 值)[4]。 Idotp 代表測定的同位分布和理論同位素分布的相似度。篩選 idotp 值大于 0.8 的母離子作為可信的定量肽段。
500 ng Hela 細(xì)胞裂解液用相同的色譜柱,相同的色譜梯度,將 QE HF 切換至 DIA 掃描模式進(jìn)行 3 次 DIA 數(shù)據(jù)采集。在一次掃描循環(huán)中,目標(biāo)母離子質(zhì)核比范圍 400–1000,四極桿的隔離窗口為 12 Da,包含 50 次 MS/MS 掃描。每一張 MS/MS譜圖中包含了 12 Da 窗口內(nèi)的所有母離子的碎片離子信息。 QEHF 使用了超高場的 Orbitrap,掃描速度是 20 Hz,所以每次循環(huán)所用的時(shí)間約為 2.4–3 s,與色譜兼容(圖 2)。 Skyline 處理DIA 數(shù)據(jù)時(shí)從譜圖庫中選取強(qiáng)度最高的多個(gè)碎片離子進(jìn)行色譜峰抽提。 Skyline 中嵌入的 mProphet 軟件會根據(jù)同一肽段的多個(gè)子離子峰的 feature 進(jìn)行打分。 Feature 包括子離子共流出峰形、保留時(shí)間偏差、 dotp 值、信噪比等。為了區(qū)分假陽性的子離子峰, mProphet 可以建立 decoy 庫,也可以將打分排名第二的肽段作為decoy,計(jì)算 FDR[5,6]。篩選 FDR < 0.01 的肽段段作為可信的定量肽段(圖 1)。
圖 2. QE HF 掃描目標(biāo)質(zhì)核比窗口 400–1000 采集 50 張 MS/MS 所需時(shí)間在 2.4–3 s
2. DDA 鑒定結(jié)果以及譜圖庫建立
500 ng Hela 細(xì)胞進(jìn)行 60 min 色譜梯度進(jìn)行 DDA 數(shù)據(jù)采集。在 60 min 內(nèi),三次重復(fù), QE HF 分別采集到49065、 49031、 48885張譜圖,鑒定到 22030、 21820、 21654 個(gè)肽段,對應(yīng)到約 3909、 3900、 3878 個(gè)蛋白。將三次的肽段和蛋白合并,一共鑒定到32446 個(gè)肽段, 4510 個(gè)蛋白(圖 3)。蛋白和肽段鑒定結(jié)果導(dǎo)入 skyline 建立譜圖庫。通過該譜圖庫,在 skyline 中建立需定量的候選肽段和蛋白。為了提高蛋白定量的準(zhǔn)確性,在 skyline 中設(shè)置一些肽段的限制條件, m/z 400–1000,母離子電荷 2+– 4+,無漏切位點(diǎn)。 32446 個(gè)肽段中符合這些條件的肽段有 29686 個(gè),對應(yīng) 4296 個(gè)蛋白。在 DDA 定量實(shí)驗(yàn)中,為每個(gè)候選肽段添加強(qiáng)度最高的3 個(gè)同位素峰(M、 M+1、 M+2)作為定量離子,共生成 89027 個(gè)定量離子。在 DIA 定量實(shí)驗(yàn)中,為每個(gè)肽段添加 5 個(gè)強(qiáng)度最高的子離子(b3-bn, y3-yn),共生成 145736 個(gè)定量離子。
圖 3. 500 ng Hela 細(xì)胞裂解液 3 次 DDA 鑒定結(jié)果(A)鑒定到的蛋白交蓋圖(B)鑒定到的肽段的交蓋圖
3. 基于母離子的 DDA 定量和基于子離子的 DIA 定量結(jié)果比較
對于 DDA 定量, skyline 會從 DDA 數(shù)據(jù)一級譜圖中進(jìn)行母離子同位素峰抽提。篩選同位素分布與理論同位素分布較好的肽段作為可靠的定量肽段,即 idotp > 0.8。由于 DDA、 DIA 實(shí)驗(yàn)中用的是相同的色譜梯度, DDA 實(shí)驗(yàn)中肽段的保留時(shí)間信息可以傳遞給 DIA 實(shí)驗(yàn)。所以在 DIA 定量時(shí),限制 skyline 只抽提該肽段譜庫中保留時(shí)間 5 min 范圍內(nèi)的子離子。通過保留時(shí)間限制可以降低 DIA 數(shù)據(jù)處理的復(fù)雜度和提高定量的準(zhǔn)確度。同時(shí)篩選 Q value < 0.01 的肽段最為可靠的定量肽段。
三次 DDA 實(shí)驗(yàn)從一級譜圖中分別定量到 25214、 25515、 24873個(gè)肽段; 3969、 3975、 3917 個(gè)蛋白;定量到的肽段占總候選肽段的 84%;峰面積的 CV 值在 20% 以下的占總定量肽段的58.81%; CV 值在 10% 以下的占 25.25%(圖 4)。三次 DIA 定量分別定量到 27558、 27604、 27483 個(gè)肽段; 4067、 4080、 4073 個(gè)蛋白。定量到的肽段張總候選肽段的 93%;峰面積的CV 值在 20% 以下的占總定量肽段的 90.3%; CV 值在 10% 以下的占 69.01%(圖 5)?梢钥闯 DIA 能夠定量到更多的肽段,而且定量肽段的峰面積 CV 值遠(yuǎn)遠(yuǎn)小于 DDA。
圖 4. 3 次 DDA 實(shí)驗(yàn)和 3 次 DIA 實(shí)驗(yàn)定量到的肽段和蛋白
圖 5. DDA 定量和 DIA 定量母離子和子離子峰面積 CV
結(jié)論
DDA 一般用于蛋白/肽段鑒定,同時(shí)可以基于母離子進(jìn)行的定量,在非常復(fù)雜的基質(zhì)中,非常容易受到其他肽段的干擾,導(dǎo)致定量不準(zhǔn)確, CV 值過大。 DIA 定量是基于二級子離子的定量,用子離子定量會提高定量的選擇性,降低其他肽段的干擾,定量會比基于一級峰面積的定量更加準(zhǔn)確, CV 值較小。該實(shí)驗(yàn)中,用 500 ng Hela 細(xì)胞裂解液評價(jià) DDA 定量和 DIA 定量能力。 3 次 DDA 實(shí)驗(yàn)鑒定到 32446 個(gè)肽段, 4510 個(gè)蛋白。將鑒定到的蛋白和肽段導(dǎo)入 skyline 建立譜圖庫,篩選出 4296個(gè)候選定量蛋白, 29686 個(gè)候選定量肽段,作為 DDA 和 DIA共同定量目標(biāo)。 DDA 定量到了 84% 的肽段, 92% 的蛋白;而DIA 定量到了 93% 的肽段, 95% 的蛋白。 DIA 比 DDA 能定量到更多的肽段和蛋白,同時(shí) DIA 定量子離子峰面積的 CV 遠(yuǎn)遠(yuǎn)小于 DDA 定量母離子峰面積的 CV。結(jié)果表明,基于二級子離子的定量要由于基于一級母離子的定量。
QE HF 在一小時(shí)梯度內(nèi)就能從 500 ng Hela 細(xì)胞裂解液鑒定并定量 4000 個(gè)蛋白,這得益于 QE HF 較好的離子傳輸效率,超快的掃描速度。目前 DIA 定量基于一維反向色譜質(zhì)譜聯(lián)用分析還不適用于二維色譜質(zhì)譜聯(lián)用分析。但是可以通過延長一維反向色譜的梯度,提高分離效率達(dá)到細(xì)胞蛋白質(zhì)組的全覆蓋。 Matthais Mann 研究小組 2014 年用一維反向色譜在小鼠NSC-34 和 N2a 細(xì)胞裂解液 240 min 色譜圖梯度,就鑒定到了8000 多蛋白,基本上達(dá)到細(xì)胞系蛋白組全覆蓋[7]。通過 DDA鑒定肽段蛋白,建立譜圖庫, DIA 進(jìn)行蛋白定量可能成為定量蛋白質(zhì)組學(xué)新的發(fā)展方向。
參考文獻(xiàn)
1. Gillet, L C. et al. Targeted data extraction of the MS/MS spectra generated by data-independent acquisition: a new concept forconsistent and accurate proteome analysis. Mol Cell Proteomics, 2012, 11(6): O111 016717.
2. Kelstrup, C D. et al. Rapid and deep proteomes by faster sequencing on a benchtop quadrupole ultra-high-field orbitrap mass spectrometer. J Proteome Res, 2014,13(12):6187-6195.
3. Scheltema R A. et al. The Q Exactive HF, a benchtop massspectrometer with a pre-filter, high performance quadrupole andan ultra-high field orbitrap analyzer. Mol Cell Proteomics, 2014,
13(12):3698-3708
4. Abbatiello S E. et al. Design, implementation, and multi-site evaluation of a system suitability protocol for the quantitative assessment of instrument performance in LC-MRM-MS. Mol Cell Proteomics, 2013, 12(9):2623-2639
5. Reiter, L. et al. mProphet: automated data processing and statistical validation for large-scale SRM experiments. Nat. Methods.2011, 8 (5):430-435
6. Röst H L. et al. OpenSWATH enables automated, targeted analysis of data-independent acquisition MS-data. Nat. Biotechnol. 2014,32(3):219-223
7. Horburg D. et al. Deep Proteomic Evaluation of Primary and Cell Line Motoneuron Disease Models Delineates Major Differences in Neuronal Characteristics. Mol Cell Proteomics, 2014, 13(12):3410-3420