近日,四川大學(xué)華西基礎(chǔ)醫(yī)學(xué)與法醫(yī)學(xué)學(xué)院的侯一平教授團(tuán)隊基于國產(chǎn)QNome納米孔測序平臺,在法醫(yī)遺傳學(xué)的TOP期刊Forensic Science International: Genetics上在線發(fā)表題為《CmVCall: an automated and adjustable nanopore analysis pipeline for heteroplasmy detection of the control region in human mitochondrial genome》的研究成果。
研究團(tuán)隊基于齊碳科技納米孔QNome測序平臺自主開發(fā)了mtDNA控制區(qū)異質(zhì)性檢測分析全流程—CmVCall,研究結(jié)果表明齊碳QNome平臺對線粒體控制區(qū)序列識別具有簡便性和適用性。
此研究為納米孔基因測序技術(shù)常規(guī)應(yīng)用于線粒體基因組奠定了堅實的基礎(chǔ),也進(jìn)一步拓展了齊碳科技納米孔測序平臺的應(yīng)用場景。
背景
線粒體DNA(mitochondrial DNA,mtDNA)是真核生物中獨立于核基因組之外的遺傳物質(zhì),呈閉環(huán)雙鏈結(jié)構(gòu),具有母系遺傳、多拷貝、異質(zhì)性閾值效應(yīng)及變異率較高等特點。由于mtDNA 特殊的遺傳特征和環(huán)狀分子結(jié)構(gòu),mtDNA檢測分析在法醫(yī)學(xué)、群體遺傳學(xué)、人類生態(tài)學(xué)、分子進(jìn)化和考古學(xué)有重要的應(yīng)用意義。
mtDNA序列及異質(zhì)性分析在很大程度上依賴于測序技術(shù)。Sanger測序由于流程相對繁瑣、分辨率較低、通量不足;在mtDNA異質(zhì)性應(yīng)用中往往受限。下一代測序技術(shù)(NGS)本質(zhì)為短讀長測序,分析mtDNA需要拼接多個短片段擴(kuò)增子,擴(kuò)增效率對異質(zhì)性比例的識別存在潛在影響。此外,短片段擴(kuò)增的非特異性容易受到核線粒體DNA(nuclear mitochondrial DNA,NUMT)序列的影響,從而使mtDNA分析變得復(fù)雜。
作為最新一代基因測序技術(shù),納米孔測序可利用其讀長長、實時測序的天然優(yōu)勢改善或避免以上限制,為異質(zhì)性檢測提供全新的方法和見解。目前,納米孔測序技術(shù)的應(yīng)用已在多個臨床和生物學(xué)領(lǐng)域得到了開發(fā),然而,利用該技術(shù)進(jìn)行mtDNA異質(zhì)性檢測的研究報道卻還很少。
作為國內(nèi)首家自主研發(fā)納米孔基因測序技術(shù)的齊碳科技,QNome平臺已被應(yīng)用于各種生物學(xué)研究,平臺在微單倍型遺傳標(biāo)記的分型研究結(jié)果已發(fā)表于Forensic Science International: Genetics (2022, 57, 102657),其法醫(yī)適用性也得到了初步證實。(
點擊此處即可跳轉(zhuǎn)閱讀原文)
此次,侯一平教授團(tuán)隊基于齊碳QNome平臺,進(jìn)一步開展納米孔基因測序技術(shù)在線粒體基因組研究的應(yīng)用探索,以期改善傳統(tǒng)測序技術(shù)帶來的局限性,獲得更高準(zhǔn)確性的檢測結(jié)果。
成果概述
研究團(tuán)隊首先評估了四種常用的variant callers在人類mtDNA控制區(qū)異質(zhì)性認(rèn)證中的性能,基于模擬混合兩個合成序列( rCRS 和SSHS)樣本的QNome納米孔測序reads產(chǎn)生的不同比例(50:50, 75:25, 80:20, 85:15, 90:10, 95:5)的混合樣本。
隨后,基于QNome測序平臺自主開發(fā)了mtDNA控制區(qū)異質(zhì)性檢測分析框架—CmVCall,該工具整合了多個數(shù)據(jù)處理程序,可執(zhí)行讀取過濾、去除核線粒體序列(numt)、比對、可選擇的“校正”模式和最終的異質(zhì)性識別,并驗證了其在低異質(zhì)性水平上的表現(xiàn)。
Fig1 CmVCall pipeline.
同卵雙胞胎(MZ)由于特殊的胚胎發(fā)生機(jī)制,具有極其相似的遺傳特征。從早期的遺傳“共識(一致性)”角度來看,他們的遺傳信息甚至是完全一樣的,無法通過常規(guī)的法庭科學(xué)DNA檢測手段來區(qū)分,也對法醫(yī)調(diào)查提出了挑戰(zhàn)。在本研究中,為了探究納米孔測序技術(shù)在雙胞胎線粒體異質(zhì)性識別中的潛力,研究團(tuán)隊還使用來自同卵雙胞胎(MZ)的血液、唾液和毛發(fā)樣本進(jìn)行異質(zhì)性檢測評估,并與NGS平臺數(shù)據(jù)進(jìn)行比較。
成果亮點
1.納米孔測序結(jié)果表明CmVCall具有很高的準(zhǔn)確性,可用于納米孔測序數(shù)據(jù)mtDNA控制區(qū)的異質(zhì)性檢測。使用“無校正”選項,pipeline可以檢測到低至10%的異質(zhì)性水平,而使用“校正”選項,可以準(zhǔn)確識別5%的低頻異質(zhì)性位點,精度、準(zhǔn)確性和召回率分別為100%、99.9%和92.3%。
Fig.2Accuracy, precision, and recall of six simulation ratios with ‘No correction’
Fig.3. Accuracy, precision, and recall of six simulation ratios with ‘Correction’
2. 人類線粒體基因組中多聚物(homopolymer)區(qū)域的分析一直是生物信息分析學(xué)研究中的一個挑戰(zhàn)。以往的研究在檢測異質(zhì)性時,通常會丟棄這些區(qū)域。為了減少這些區(qū)域的錯誤率,測序生化體系和分析工具均在不斷改進(jìn)中。本研究中,通過納米孔測序結(jié)合pipeline工具的嚴(yán)格過濾,避免了數(shù)據(jù)分析過程中不必要的“丟棄”,從而獲得更高水平的個體間和個體內(nèi)多態(tài)位點。
將QNome平臺和Ion Torrent 平臺產(chǎn)生的測序數(shù)據(jù)進(jìn)行對比,結(jié)果顯示,兩個平臺的異質(zhì)性調(diào)用呈現(xiàn)一定程度的一致性。納米孔測序基于“校正”模式可以比NGS平臺識別出更多的異質(zhì)性,并在具有高覆蓋率的多聚物區(qū)域也識別出異質(zhì)性位點,顯示出納米孔測序技術(shù)的應(yīng)用潛力。
3.研究團(tuán)隊統(tǒng)計了每對雙胞胎三種類型樣本之間的mtDNA控制區(qū)微小差異。結(jié)果表明基于NGS數(shù)據(jù),四對MZ雙胞胎的兩個體可以通過毛發(fā)樣本的異質(zhì)性位點被區(qū)分開來,而基于QNome校正數(shù)據(jù),雙胞胎樣本的三種樣本類型的mtDNA控制區(qū)檢測出更多的異質(zhì)性,可以區(qū)分全部7對雙胞胎樣本中的兩個體。
Fig. 6. The accuracy, precision, and recall of four analytical tools (CmVCall, LoFreq, LongShot, and marginAlign) under six simulation ratios. This figure is based on QNome correction data.
結(jié)語
綜上所述,CmVCall具有很高的準(zhǔn)確性,并且適合用于利用納米孔測序數(shù)據(jù)進(jìn)行mtDNA控制區(qū)的異質(zhì)性檢測。在“校正”選項下,5%水平異質(zhì)性的精度、準(zhǔn)確性和召回率分別為100%、99.9%和92.3%。在使用MZ樣本的驗證和比較中,結(jié)果表明,CmVCall可以比NGS能夠識別到更多的異質(zhì)性位點,揭示了個體間和個體內(nèi)mtDNA細(xì)微差別。同時,該研究還鑒定了一些具有極高覆蓋率和可信度的homopolymer異質(zhì)性位點,這意味著利用納米孔測序和CmVCall檢測這些區(qū)域的異質(zhì)性具有潛力。
研究團(tuán)隊表示,針對homopolymer區(qū)域的額外驗證方法和新工具的不斷開發(fā)仍然是非常必要的。此次研究的調(diào)查樣本量仍然較小,預(yù)計將基于齊碳納米孔測序技術(shù)繼續(xù)使用CmVCall分析更多類型的數(shù)據(jù)集和更大的樣本量以進(jìn)一步進(jìn)行估計和改進(jìn),相信這一工具將為未來開發(fā)針對線粒體全基因組的納米孔測序pipeline奠定堅實基礎(chǔ)。
作為國內(nèi)第一家全面掌握納米孔測序技術(shù)并將之推向商業(yè)化的企業(yè),齊碳持續(xù)技術(shù)研發(fā)、擴(kuò)充產(chǎn)品矩陣,不斷解鎖更多應(yīng)用場景,讓這項高精尖的技術(shù)產(chǎn)生更多的現(xiàn)實生產(chǎn)力。
目前,已經(jīng)形成了以基因測序儀為核心,配套有試劑、芯片及軟件的測序平臺。此外還有實驗室自動化、生信分析等應(yīng)用支撐產(chǎn)品,形成了完整的基因測序全鏈條解決方案。
今年3月,齊碳重磅發(fā)布了全新迭代升級的K2體系,帶來了更準(zhǔn)、更穩(wěn)、更高效的測序體驗。單次準(zhǔn)確率從90%躍升至97%,Consensus 準(zhǔn)確率(70x)從Q40提升至Q50,不僅 Homopolymer 分辨能力大幅提升,還實現(xiàn)了高精度短序列測序,同時上樣量也大幅減少。
8月18日,齊碳時隔一年再發(fā)新品,重磅推出自主研發(fā)的中通量納米孔基因測序平臺QPursue,從低通量QNome測序平臺擴(kuò)展到中通量測序平臺QPursue,不僅展現(xiàn)了齊碳強勁的研發(fā)實力和創(chuàng)新能力,也代表著國內(nèi)納米孔基因測序技術(shù)的最前沿水平。
未來,齊碳科技將持續(xù)深耕,不斷提升測序性能、降低測序成本,充分挖掘納米孔測序技術(shù)的優(yōu)勢潛能,推動納米孔測序技術(shù)迭代和產(chǎn)業(yè)化應(yīng)用,加速納米孔基因測序儀國產(chǎn)化時代進(jìn)程!
特別鳴謝四川大學(xué)華西基礎(chǔ)醫(yī)學(xué)與法醫(yī)學(xué)學(xué)院的侯一平教授團(tuán)隊對本文的指導(dǎo)!
參考文獻(xiàn):
[1]Lirong Jiang, Jing Liu,Suyu Li,et,al. CmVCall: an automated and adjustable nanopore analysis pipeline for heteroplasmy detection of the control region in human mitochondrial genome.Forensic Science International: Genetics.Volume 67, November 2023, 102930.
2021年12月,齊碳科技通過5年的自主研發(fā),成功推出國內(nèi)首臺商業(yè)化的納米孔基因測序儀QNome-3841,并宣布首個生產(chǎn)基地竣工,正式開啟納米孔基因測序國產(chǎn)化時代。2022年6月,齊碳科技發(fā)布納米孔基因測序儀QNome-3841hex,標(biāo)志著國產(chǎn)納米孔基因測序儀開始了矩陣化發(fā)展,這也為靈活測序場景提供全新的解決方案,將更好地滿足市場應(yīng)用的多元需求。