English | 中文版 | 手機(jī)版 企業(yè)登錄 | 個人登錄 | 郵件訂閱
當(dāng)前位置 > 首頁 > 技術(shù)文章 > BSA 混池分組分析法原理、方案設(shè)計及在性狀定位上的優(yōu)勢

BSA 混池分組分析法原理、方案設(shè)計及在性狀定位上的優(yōu)勢

瀏覽次數(shù):13252 發(fā)布日期:2021-7-15 

提到性狀定位,我們通常會想到大群體、復(fù)雜算法、耗資巨大,例如全基因組關(guān)聯(lián)分析。今天向大家介紹的 BSA 則不同,這種方法不僅材料容易準(zhǔn)備、算法原理清晰明了,更重要的是不需要花費高額經(jīng)費,十分適合性狀初定位。
 

BSA 混池分組分析法簡介

BSA(bulked segregant analysis)混池分組分析法,根據(jù)目標(biāo)性狀表型對分離群體中的個體分別進(jìn)行分組混合,依據(jù)目標(biāo)性狀的相對差異選擇表型極端的個體分成兩組,然后將兩組的個體或株系 DNA 混合,形成相對的 DNA 混合池。通過在親本和子代混池之間的多態(tài)性標(biāo)記篩選即可完成對目標(biāo)性狀的定位。


BSA 適用群體

關(guān)于性狀定位常用的群體類型有兩種,一種是自然群體(個體間遺傳背景差異較大,通常來自不同地域、不同品種、甚至于不同進(jìn)化程度的材料),另一種是家系群體(群體遺傳背景較為相似,通常全部來自于兩個親本個體,在目標(biāo)性狀上有明顯表型分離)。

BSA 采用的是家系群體,常用的家系群體有 F2、BC(n)、RIL、DH 等等。對于家系群體的構(gòu)建,親本選擇建議:同一物種前提下,目標(biāo)性狀盡可能差異大的兩個個體。


BSA 原理及分析邏輯
BSA 中通常需要測序 4 個樣本:兩個親本+兩個子代混池

測序拿到原始數(shù)據(jù)后,可通過質(zhì)控、與參考基因組比對、SNP calling 等步驟得到各樣本 SNP 標(biāo)記分型信息。對于重測序而言,無論是 BSA 還是其他性狀定位方法,SNP 分型信息是后續(xù)分析的基礎(chǔ)。


接下來如何從海量的 SNP 標(biāo)記中篩選到與性狀性格的那一部分,進(jìn)而定位到性狀相關(guān)基因是關(guān)鍵。對于“雙親健全”(因為實際情況可能只有兩個子代混池)的 BSA 項目來說,是一個三步走策略:


Step 1. 篩選兩親本間純合且差異的標(biāo)記

家系群體構(gòu)建時我們知道,首先選擇在目標(biāo)性狀上差異明顯的個體為親本,表型有差異,跟表型相關(guān)的 SNP 標(biāo)記就一定有差異。在親本之間無差異的SNP可以先篩掉,剩余的親本間純合且差異的這部分再借助子代混池進(jìn)一步聚焦。
 

Step 2. 子代混池篩選SNP標(biāo)記并獲得候選區(qū)間

標(biāo)記與性狀進(jìn)行關(guān)聯(lián)是性狀定位最核心的部分,對于 BSA 而言,有兩種關(guān)聯(lián)方法,一種是 ΔSNP-Index,一種是歐式距離(Euclidean distance, ED)。

ΔSNP-Index

SNP-Index可以理解成突變位點遺傳物質(zhì)來源于某一個親本的頻率,對于混池的某一個位點來說,SNP-Index即為該位點與某親本序列相同的reads占總reads的比例。而Δ SNP-Index即為2個混池之間SNP-Index的差值;胺绞接嬎愀鲄^(qū)域的Δ SNP-Index,通過置信區(qū)間的設(shè)置可以判斷區(qū)域是否與目的性狀存在關(guān)聯(lián)。

歐式距離(Euclidean distance, ED)

歐式距離計算將混池中每一個位點的突變信息抽象成坐標(biāo)上的一個點,并計算混池之間每個相同位點之間的歐氏距離:

ED2=(A1-A2)2+(T1-T2)2+(C1-C2)2+(G1-G2)2

An、Tn、Cn、Gn 分別指 ATCG 四種堿基在混池 n 中的頻率

取所有位點擬合值的 median+3SD 作為分析的關(guān)聯(lián)閾值,根據(jù)關(guān)聯(lián)閾值判定候選區(qū)間。


Step 3. 區(qū)間內(nèi)候選基因注釋及功能富集

篩選 SNP 位點不是目的,關(guān)于結(jié)果,候選區(qū)域更具有生物學(xué)意義。確定候選區(qū)間后,注釋區(qū)間內(nèi)所包含的基因,并對候選基因集做 KEGG、GO 富集分析。


BSA方案設(shè)計
說到方案,主要涉及三個方面:親本測序深度、子代混池樣本數(shù)、子代混池測序深度。方案設(shè)計是否合理直接關(guān)系到結(jié)果定位的精度和項目費用。
 

極端混池的樣本數(shù)量越多,混池測序深度越高,定位結(jié)果精度越高,但同時項目費用也會越高。有學(xué)者借助模式植物擬南芥專門針對子代混池樣本數(shù)和測序深度對定位結(jié)果的影響進(jìn)行了研究。結(jié)果發(fā)現(xiàn),當(dāng)混池樣本數(shù)量達(dá)到 20 個,同時測試深度在 20X 以上的情況下,能夠得到相對理想的定位結(jié)果。超過這個數(shù)量,隨著成本消耗的增加,定位精度的提升效果有限。綜合考慮,通常推薦方案如下:

親本測序深度

10X

子代混池樣本數(shù)

20個

子代池測序深度

20X

注:推薦方案不能適用于所有項目,具體方案要根據(jù)項目具體情況而定


BSA 結(jié)果展示

高通量測序項目的結(jié)題報告內(nèi)容向來比較多,包括各種形式的圖表展示,抓住重點才能讓我們對結(jié)果的解讀準(zhǔn)確而高效。對于 BSA 而言,要重點關(guān)注以下幾個方面:

  • 候選區(qū)域

  • 候選區(qū)域內(nèi)基因注釋

  • 基因功能富集


結(jié)果細(xì)節(jié)

< BSA-demo報告 >

 

BSA 常見問題

Q1:沒有參考基因組的物種可以做 BSA 嗎?

BSA 性狀定位的方法適用于有參考基因組的物種。參考基因組組裝質(zhì)量好壞以及注釋是否完全對 BSA 結(jié)果有一定的影響。建議盡量選擇組裝至染色體水平,且基因組注釋較完全的參考基因組。

 

Q2:混池樣本如何選擇,一定要到 20 個嗎?

混池的樣本數(shù)通常選取極端性狀(群體總樣本數(shù)的 5~10% 內(nèi))的個體進(jìn)行混池;斐刂腥魳O端性狀個體數(shù)太少,可能造成樣品數(shù)不夠,不具備代表性;若樣本數(shù)過高可能會引入雜合個體,產(chǎn)生干擾。需要根據(jù)群體的實際情況,首先保證表型足夠極端,其次考慮樣本數(shù)量。不一定必須到 20。例如,某兔子毛色性狀定位研究,通過兩親本雜交、F1 個體混交,得到 35 只 F2 個體,將極端表型控制在 20% 以內(nèi),分別選擇 5 只、6 只進(jìn)行混合,測序深度各為 10X,也得到了較為理想的定位結(jié)果。


Q3:影響定位結(jié)果的因素?

評估定位結(jié)果主要參考候選區(qū)域大小和候選基因個數(shù),影響它們的因素包括但不限于兩親本材料的差異大小、家系群體大小及性狀分離情況、子代混池個數(shù)、親本及子代混池測序深度、參考基因組水平、目標(biāo)性狀特點等。


Q4:子代混池構(gòu)建是先提取在混合還是先混合再提?

先提 DNA 再等量混合,可以減少系統(tǒng)誤差,近年發(fā)表的多數(shù)文獻(xiàn)都是先提 DNA 再等量混合。


Q5:BSA性狀定位是否可以采用簡化基因組測序?

簡化基因組捕獲的基因組區(qū)域有限,一般僅能捕獲 3%~30%,如果變異的區(qū)域正好沒有捕獲到就不能找到目標(biāo)性狀的基因了。因此用簡化基因組的風(fēng)險很大,不建議做簡化基因組的BSA性狀定位。

當(dāng)然要做性狀定位研究,除了 BSA,還有遺傳連鎖圖譜、全基因組關(guān)聯(lián)分析等經(jīng)典方案,有任何疑問可聯(lián)系技術(shù)專家為您免費答疑解惑哦。

來源:上海雅吉生物科技有限公司
聯(lián)系電話:021-34661275
E-mail:58268971@qq.com

標(biāo)簽: 性狀定位 BSA 測序
用戶名: 密碼: 匿名 快速注冊 忘記密碼
評論只代表網(wǎng)友觀點,不代表本站觀點。 請輸入驗證碼: 8795
Copyright(C) 1998-2024 生物器材網(wǎng) 電話:021-64166852;13621656896 E-mail:info@bio-equip.com