"De novo" 測(cè)序技術(shù)是生物信息學(xué)中的一種技術(shù),主要用于確定新的或未知的蛋白質(zhì)或肽段的氨基酸序列。與重復(fù)測(cè)序相比,這項(xiàng)技術(shù)特別關(guān)注那些尚未被鑒定或者在已有數(shù)據(jù)庫(kù)中沒(méi)有的蛋白質(zhì)或肽段。
一、 為什么需要De novo測(cè)序?
盡管存在大量的已知蛋白質(zhì)序列數(shù)據(jù),但仍然有大量的蛋白質(zhì)和肽段的序列和功能尚未被發(fā)現(xiàn)。De novo測(cè)序可以幫助研究人員揭示這些尚未鑒定的蛋白質(zhì)或肽段的氨基酸序列。
二、如何進(jìn)行De novo測(cè)序?
De novo測(cè)序主要依賴質(zhì)譜技術(shù),特別是串聯(lián)質(zhì)譜 (Tandem Mass Spectrometry, MS/MS)。在該技術(shù)中,肽段被電離并進(jìn)入質(zhì)譜儀,在那里它們被進(jìn)一步分裂成較小的碎片。這些碎片的質(zhì)量被測(cè)量并用于推斷原始肽段的氨基酸序列。
三、解析未知肽段的結(jié)構(gòu)與功能:
1、結(jié)構(gòu)解析:
通過(guò)De novo測(cè)序得到的氨基酸序列可以被用于預(yù)測(cè)蛋白質(zhì)的三維結(jié)構(gòu),F(xiàn)代的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)算法,如AlphaFold,已經(jīng)可以基于氨基酸序列準(zhǔn)確地預(yù)測(cè)蛋白質(zhì)的三維結(jié)構(gòu)。
2、功能解析:
一旦得到了肽段或蛋白質(zhì)的結(jié)構(gòu)信息,研究人員可以進(jìn)一步進(jìn)行功能實(shí)驗(yàn),如結(jié)合實(shí)驗(yàn)、酶活性測(cè)定等,來(lái)確定其生物學(xué)功能。此外,通過(guò)與已知蛋白質(zhì)或功能域的比較,也可以推測(cè)其功能。
圖1
四、De novo測(cè)序的挑戰(zhàn):
1、碎片解析的復(fù)雜性:
根據(jù)碎片的質(zhì)量推斷原始肽段的序列是復(fù)雜的,并且可能會(huì)有多種可能的序列。
2、長(zhǎng)肽段的測(cè)序難度:
長(zhǎng)肽段可能會(huì)產(chǎn)生大量的碎片,這使得序列推斷更加困難。
3、數(shù)據(jù)量大:
De novo測(cè)序產(chǎn)生的數(shù)據(jù)量通常很大,需要強(qiáng)大的計(jì)算能力和專業(yè)的軟件來(lái)分析。