當(dāng)前位置 > 首頁 > 技術(shù)文章 > BSA 混池分組分析法原理、方案設(shè)計及在性狀定位上的優(yōu)勢

選型 | 市場 | 應(yīng)用 | 使用 | 法規(guī) | 技術(shù) | 其他

BSA 混池分組分析法原理、方案設(shè)計及在性狀定位上的優(yōu)勢

瀏覽次數(shù)：13252　發(fā)布日期：2021-7-15　

提到性狀定位，我們通常會想到大群體、復(fù)雜算法、耗資巨大，例如全基因組關(guān)聯(lián)分析。今天向大家介紹的 BSA 則不同，這種方法不僅材料容易準(zhǔn)備、算法原理清晰明了，更重要的是不需要花費高額經(jīng)費，十分適合性狀初定位。

BSA 混池分組分析法簡介

BSA（bulked segregant analysis）混池分組分析法，根據(jù)目標(biāo)性狀表型對分離群體中的個體分別進(jìn)行分組混合，依據(jù)目標(biāo)性狀的相對差異選擇表型極端的個體分成兩組，然后將兩組的個體或株系 DNA 混合，形成相對的 DNA 混合池。通過在親本和子代混池之間的多態(tài)性標(biāo)記篩選即可完成對目標(biāo)性狀的定位。

BSA 適用群體

關(guān)于性狀定位常用的群體類型有兩種，一種是自然群體（個體間遺傳背景差異較大，通常來自不同地域、不同品種、甚至于不同進(jìn)化程度的材料），另一種是家系群體（群體遺傳背景較為相似，通常全部來自于兩個親本個體，在目標(biāo)性狀上有明顯表型分離）。

BSA 采用的是家系群體，常用的家系群體有 F2、BC（n）、RIL、DH 等等。對于家系群體的構(gòu)建，親本選擇建議：同一物種前提下，目標(biāo)性狀盡可能差異大的兩個個體。

BSA 原理及分析邏輯
BSA 中通常需要測序 4 個樣本：兩個親本+兩個子代混池

測序拿到原始數(shù)據(jù)后，可通過質(zhì)控、與參考基因組比對、SNP calling 等步驟得到各樣本 SNP 標(biāo)記分型信息。對于重測序而言，無論是 BSA 還是其他性狀定位方法，SNP 分型信息是后續(xù)分析的基礎(chǔ)。

接下來如何從海量的 SNP 標(biāo)記中篩選到與性狀性格的那一部分，進(jìn)而定位到性狀相關(guān)基因是關(guān)鍵。對于“雙親健全”（因為實際情況可能只有兩個子代混池）的 BSA 項目來說，是一個三步走策略：

Step 1. 篩選兩親本間純合且差異的標(biāo)記

家系群體構(gòu)建時我們知道，首先選擇在目標(biāo)性狀上差異明顯的個體為親本，表型有差異，跟表型相關(guān)的 SNP 標(biāo)記就一定有差異。在親本之間無差異的SNP可以先篩掉，剩余的親本間純合且差異的這部分再借助子代混池進(jìn)一步聚焦。

Step 2. 子代混池篩選SNP標(biāo)記并獲得候選區(qū)間

標(biāo)記與性狀進(jìn)行關(guān)聯(lián)是性狀定位最核心的部分，對于 BSA 而言，有兩種關(guān)聯(lián)方法，一種是 ΔSNP-Index，一種是歐式距離（Euclidean distance, ED）。

ΔSNP-Index

SNP-Index可以理解成突變位點遺傳物質(zhì)來源于某一個親本的頻率，對于混池的某一個位點來說，SNP-Index即為該位點與某親本序列相同的reads占總reads的比例。而Δ SNP-Index即為2個混池之間SNP-Index的差值�；胺绞接嬎愀鲄^(qū)域的Δ SNP-Index，通過置信區(qū)間的設(shè)置可以判斷區(qū)域是否與目的性狀存在關(guān)聯(lián)。

歐式距離（Euclidean distance, ED）

歐式距離計算將混池中每一個位點的突變信息抽象成坐標(biāo)上的一個點，并計算混池之間每個相同位點之間的歐氏距離：

ED²=(A1-A2)²+(T1-T2)²+(C1-C2)²+(G1-G2)²

An、Tn、Cn、Gn 分別指 ATCG 四種堿基在混池 n 中的頻率

取所有位點擬合值的 median+3SD 作為分析的關(guān)聯(lián)閾值，根據(jù)關(guān)聯(lián)閾值判定候選區(qū)間。

Step 3. 區(qū)間內(nèi)候選基因注釋及功能富集

篩選 SNP 位點不是目的，關(guān)于結(jié)果，候選區(qū)域更具有生物學(xué)意義。確定候選區(qū)間后，注釋區(qū)間內(nèi)所包含的基因，并對候選基因集做 KEGG、GO 富集分析。

BSA方案設(shè)計
說到方案，主要涉及三個方面：親本測序深度、子代混池樣本數(shù)、子代混池測序深度。方案設(shè)計是否合理直接關(guān)系到結(jié)果定位的精度和項目費用。

極端混池的樣本數(shù)量越多，混池測序深度越高，定位結(jié)果精度越高，但同時項目費用也會越高。有學(xué)者借助模式植物擬南芥專門針對子代混池樣本數(shù)和測序深度對定位結(jié)果的影響進(jìn)行了研究。結(jié)果發(fā)現(xiàn)，當(dāng)混池樣本數(shù)量達(dá)到 20 個，同時測試深度在 20X 以上的情況下，能夠得到相對理想的定位結(jié)果。超過這個數(shù)量，隨著成本消耗的增加，定位精度的提升效果有限。綜合考慮，通常推薦方案如下：

親本測序深度	10X
子代混池樣本數(shù)	20個
子代池測序深度	20X

注：推薦方案不能適用于所有項目，具體方案要根據(jù)項目具體情況而定

BSA 結(jié)果展示

高通量測序項目的結(jié)題報告內(nèi)容向來比較多，包括各種形式的圖表展示，抓住重點才能讓我們對結(jié)果的解讀準(zhǔn)確而高效。對于 BSA 而言，要重點關(guān)注以下幾個方面：

候選區(qū)域
候選區(qū)域內(nèi)基因注釋
基因功能富集

結(jié)果細(xì)節(jié)

< BSA-demo報告 >

BSA 常見問題

Q1：沒有參考基因組的物種可以做 BSA 嗎？

BSA 性狀定位的方法適用于有參考基因組的物種。參考基因組組裝質(zhì)量好壞以及注釋是否完全對 BSA 結(jié)果有一定的影響。建議盡量選擇組裝至染色體水平，且基因組注釋較完全的參考基因組。

Q2：混池樣本如何選擇，一定要到 20 個嗎？

混池的樣本數(shù)通常選取極端性狀（群體總樣本數(shù)的 5～10% 內(nèi)）的個體進(jìn)行混池�；斐刂腥魳O端性狀個體數(shù)太少，可能造成樣品數(shù)不夠，不具備代表性；若樣本數(shù)過高可能會引入雜合個體，產(chǎn)生干擾。需要根據(jù)群體的實際情況，首先保證表型足夠極端，其次考慮樣本數(shù)量。不一定必須到 20。例如，某兔子毛色性狀定位研究，通過兩親本雜交、F1 個體混交，得到 35 只 F2 個體，將極端表型控制在 20% 以內(nèi)，分別選擇 5 只、6 只進(jìn)行混合，測序深度各為 10X，也得到了較為理想的定位結(jié)果。

Q3：影響定位結(jié)果的因素？

評估定位結(jié)果主要參考候選區(qū)域大小和候選基因個數(shù)，影響它們的因素包括但不限于兩親本材料的差異大小、家系群體大小及性狀分離情況、子代混池個數(shù)、親本及子代混池測序深度、參考基因組水平、目標(biāo)性狀特點等。

Q4：子代混池構(gòu)建是先提取在混合還是先混合再提��？

先提 DNA 再等量混合，可以減少系統(tǒng)誤差，近年發(fā)表的多數(shù)文獻(xiàn)都是先提 DNA 再等量混合。

Q5：BSA性狀定位是否可以采用簡化基因組測序？

簡化基因組捕獲的基因組區(qū)域有限，一般僅能捕獲 3%～30%，如果變異的區(qū)域正好沒有捕獲到就不能找到目標(biāo)性狀的基因了。因此用簡化基因組的風(fēng)險很大，不建議做簡化基因組的BSA性狀定位。

當(dāng)然要做性狀定位研究，除了 BSA，還有遺傳連鎖圖譜、全基因組關(guān)聯(lián)分析等經(jīng)典方案，有任何疑問可聯(lián)系技術(shù)專家為您免費答疑解惑哦。

索取資料

來源：上海雅吉生物科技有限公司
聯(lián)系電話：021-34661275
E-mail：58268971@qq.com

【點擊可查看上海雅吉生物科技有限公司相關(guān)服務(wù)】

標(biāo)簽：性狀定位 BSA 測序

分享到：QQ空間新浪微博騰訊微博微信

【所有文章】【本類新聞】【相關(guān)服務(wù)】【關(guān)閉窗口】

本類文章

本類新聞

BSA 混池分組分析法原理、方案設(shè)計及在性狀定位上的優(yōu)勢

BSA 混池分組分析法原理、方案設(shè)計及在性狀定位上的優(yōu)勢