Plant Phenomics | 基于機(jī)器學(xué)習(xí)衍生農(nóng)業(yè)指數(shù)的植物內(nèi)源狀態(tài)分類
脫落酸(ABA)通過誘導(dǎo)葉片的生理變化,控制植物對干旱和其他環(huán)境脅迫的適應(yīng)。擬南芥ABA2基因參與催化ABA合成的最后一步?梢姽-紅外-短波紅外(VIS-NIR-SWIR)傳感器測量葉片色,光譜范圍廣,分辨率高。然而,光譜信息僅用于了解植物的一般狀況(如植被指數(shù))或植物色素含量,而不是精確定位植物中特定代謝或信號通路的缺陷。本文獲取VIS-NIR-SWIR葉片反射率,利用從新的NRIs中獲得的少量光譜特征,構(gòu)建高度可解釋和精確的支持向量機(jī)(SVM)分類器,精確定位與應(yīng)激激素脫落酸(ABA)相關(guān)的生理變化。
2023年6月,Plant Phenomics在線發(fā)表了新加坡國立大學(xué)淡馬錫生命科學(xué)實(shí)驗(yàn)室等單位題為 Classification of Plant Endogenous States Using Machine Learning-Derived Agricultural Indices 的研究論文。
本研究分別收集了野生型、ABA2過表達(dá)型和ABA2缺陷型植物在水分和干旱條件下的葉片反射光譜(圖1)。光譜比較表明,在490 ~ 680 nm處葉片反射率下降是干旱脅迫的早期指標(biāo),與葉片水分流失無關(guān),但可能與內(nèi)源ABA水平有關(guān)。
圖1水分和干旱條件下野生型(Col-0)、aba缺陷突變體(aba2)和aba2過表達(dá)系(aba2 -ox)擬南芥葉片反射光譜。
為了確定與干旱和/或內(nèi)源ABA水平相關(guān)的最佳NRIs,篩選了與對照和干旱條件以及野生和突變體高度相關(guān)的歸一化反射指數(shù)(NRIs)。
(圖2A)使用公式進(jìn)行NRI的計算,根據(jù)樣本的F值(樣本平均值之間的變化程度超過樣本內(nèi)變化的程度)進(jìn)行排序,排除ANOVA F值低(F≤20)和共線性高(|PCC|≥0.75)的NRIs,將Z-scored、log2轉(zhuǎn)換的NRIs繪制為熱圖,并繪制用RFE方法選擇的前20個NRIs的F值(圖2B)。對aba2和Col-0的前20個NRIs進(jìn)行聚類分析,結(jié)果表明aba2與aba2 -ox和Col-0具有明顯的區(qū)別。在對照和干旱條件下收集的ABA2-ox數(shù)據(jù)與干旱條件下的Col-0聚類密切,表明ABA水平升高部分模擬了干旱引起的信息光譜變化。接下來,使用小的、非冗余的NRIs集,使用SVM、RF和LogReg模型構(gòu)建可解釋分類器,將aba2與其他2個基因型(Col-0和aba2 -ox)區(qū)分開來(圖2C)。使用RBF的SVM分類器表現(xiàn)出最高的性能,平均準(zhǔn)確率為87.3%±1.4%。排列重要性檢驗(yàn)表明,隨機(jī)變換每個特征值對分類精度的影響較。▓D2D),說明SVM分類器具有較強(qiáng)的穩(wěn)定性。
圖2確定與干旱或內(nèi)源ABA水平相關(guān)的最佳NRIs(擬南芥)。
為了檢驗(yàn)所選的NRIs中拾取的光譜特征是否可能重疊,檢查了所選NRIs與常見農(nóng)業(yè)指數(shù)的關(guān)系。從Col-0和aba2對比中篩選出的少數(shù)NRIs與常規(guī)農(nóng)業(yè)指數(shù)顯示出高相關(guān)性(|PCC|≥0.75)(圖3A)。通過與生化結(jié)果的兩兩比較,進(jìn)一步評估了所選NRIs與植物色素和水分含量之間的合理關(guān)聯(lián)。方差分析F值顯示,只有少數(shù)選定的NRI與相對葉綠素含量(綠色條,圖3B)和葉片含水量(藍(lán)色條,圖3B)相關(guān),而大多數(shù)與這兩個生化結(jié)果以及類胡蘿卜素含量(灰色條,圖3B)無關(guān)。利用PLS回歸方法對原始光譜數(shù)據(jù)進(jìn)行含水量和相對葉綠素含量的預(yù)測。通過PLS回歸選擇的波長與基于aba2與Col-0和對照與干旱的比較所選擇的NRIs不一致(圖2),進(jìn)一步支持了干旱脅迫除了對水分含量的變化有充分記錄外,還涉及非特征生理變化。為了證明所選NRIs在其他物種上的表現(xiàn),使用生菜再次進(jìn)行了類似的試驗(yàn)。
圖 3 所選NRIs(ABA相關(guān))與生理變化之間的關(guān)系(擬南芥)。
本研究采用擬南芥突變體來鑒定與ABA生物合成途徑相關(guān)的光譜變化。通過對葉片反射率數(shù)據(jù)的研究,了解光譜變化,從而確定生物途徑中存在的遺傳缺陷。在未來,廣泛收集葉片反射率信息可能有助于設(shè)計和優(yōu)化強(qiáng)大的NRIs和ML模型,最終可應(yīng)用于大田。鑒于aba2突變體在早期表現(xiàn)出干旱脅迫的光譜變化(圖1至3),使用擬南芥突變體也可以減少植物脅迫實(shí)驗(yàn)所需的時間,提高過程中的效率。
作者及研究團(tuán)隊介紹
本文的第一作者是Sally Shuxian Koh,隸屬于新加坡國立大學(xué)淡馬錫生命科學(xué)實(shí)驗(yàn)室。淡馬錫生命科學(xué)實(shí)驗(yàn)室(TLL)成立于2002年,是淡馬錫信托的受益人,隸屬于新加坡國立大學(xué)和南洋理工大學(xué)。TLL主要致力于了解構(gòu)成植物,真菌和動物的發(fā)育和生理的細(xì)胞機(jī)制。這些研究為生物體如何發(fā)揮功能提供了新的理解,也為生物技術(shù)創(chuàng)新提供了基礎(chǔ)。TLL擁有國際合作伙伴網(wǎng)絡(luò),并希望通過與本地和國際合作伙伴的合作和聯(lián)合研究事業(yè),對新加坡生物技術(shù)產(chǎn)業(yè)的發(fā)展產(chǎn)生積極影響。
本文研究團(tuán)隊包括新加坡國立大學(xué)淡馬錫生命科學(xué)實(shí)驗(yàn)室,新加坡國立大學(xué)生物科學(xué)系,新加坡科學(xué)技術(shù)研究局(A*STAR)生物工程與生物成像研究所轉(zhuǎn)化生物光子學(xué)實(shí)驗(yàn)室,新加坡科學(xué)技術(shù)研究局(A*STAR)材料研究與工程研究所(IMRE)。
淡馬錫生命科學(xué)實(shí)驗(yàn)室
論文鏈接:
https://spj.science.org/doi/10.34133/plantphenomics.0060
——推薦閱讀——
https://doi.org/10.34133/plantphenomics.0070
Plant Phenomics | 分布式賬本能幫助克服農(nóng)業(yè)機(jī)器學(xué)習(xí)對標(biāo)記數(shù)據(jù)的需求嗎?
https://spj.science.org/doi/10.34133/2022/9879610
Plant Phenomics | 基于圖像增強(qiáng)和機(jī)器學(xué)習(xí)的苜蓿根系表型研究
加入作者交流群
掃碼添加小編微信,拉您進(jìn)入《植物表型組學(xué)》作者交流群,群內(nèi)不定期開展作者分享會、?l(fā)布會等高質(zhì)量活動。
添加小編微信,備注姓名+單位+PP,加入作者交流群
About Plant Phenomics
《植物表型組學(xué)》(Plant Phenomics)是由南京農(nóng)業(yè)大學(xué)和美國科學(xué)促進(jìn)會(AAAS)合作創(chuàng)辦的英文學(xué)術(shù)期刊,于2019年1月正式上線發(fā)行。采用開放獲取形式,刊載植物表型組學(xué)交叉學(xué)科熱點(diǎn)領(lǐng)域具有突破性科研進(jìn)展的原創(chuàng)性研究論文、綜述、數(shù)據(jù)集和觀點(diǎn)。具體范圍涵蓋高通量表型分析的最新技術(shù),基于圖像分析和機(jī)器學(xué)習(xí)的表型分析研究,提取表型信息的新算法,作物栽培、植物育種和農(nóng)業(yè)實(shí)踐中的表型組學(xué)新應(yīng)用,與植物表型相結(jié)合的分子生物學(xué)、植物生理學(xué)、統(tǒng)計學(xué)、作物模型和其他組學(xué)研究,表型組學(xué)相關(guān)的植物生物學(xué)等。期刊已被DOAJ、Scopus、PMC、EI和SCIE等數(shù)據(jù)庫收錄?祁Nò睯CR2022影響因子為6.5,位于農(nóng)藝學(xué)、植物科學(xué)、遙感一區(qū)。中科院農(nóng)藝學(xué)、植物科學(xué)一區(qū),遙感二區(qū),生物大類一區(qū)(TOP期刊)。2020年入選中國科技期刊卓越行動計劃高起點(diǎn)新刊項目。
說明:本文由《植物表型組學(xué)》編輯部負(fù)責(zé)組稿。
中文內(nèi)容僅供參考,一切內(nèi)容以英文原版為準(zhǔn)。
撰稿:史奕(南京農(nóng)業(yè)大學(xué))
排版:趙倩瑩(南京農(nóng)業(yè)大學(xué))
審核:孔敏、王平