數(shù)據(jù)競(jìng)賽已成為針對(duì)數(shù)據(jù)科學(xué)問題統(tǒng)籌新的數(shù)據(jù)分析方法的流行趨勢(shì)。數(shù)據(jù)競(jìng)賽在植物表型方面發(fā)展迅速,新的室外田間數(shù)據(jù)集有可能為研究和商業(yè)應(yīng)用提供解決方案。本研究利用全球小麥穗數(shù)據(jù)集(GWHD)來研究植物表型的魯棒性問題。GWHD是一個(gè)大型而全面的小麥穗定位標(biāo)記數(shù)據(jù)集。本研究基于全球小麥數(shù)據(jù)挑戰(zhàn)賽,作為 2020 年和 2021 年的通用化競(jìng)賽,旨在利用不同地區(qū)的田間圖像為小麥頭部檢測(cè)找到更穩(wěn)健的解決方案。
2023年6月,Plant Phenomics在線發(fā)表了法國INRAE等單位題為Global Wheat Head Detection Challenges: Winning Models and Application for Head Counting 的研究論文。
本研究利用基于三個(gè)不同的數(shù)據(jù)集測(cè)試和研究了小麥穗部檢測(cè)算法的魯棒性和準(zhǔn)確性。其中,本研究使用Faster-RCNN 作為基線解決方案,與GWC_2020和GWC_2021的獲獎(jiǎng)方案進(jìn)行對(duì)比。三種最佳解決方案提供的平均精度值非常接近,同時(shí)在很大程度上超過基線解決方案。
Fig.1 Sample from the UQ Frame dataset.
Fig2. Sample from the Arvalis LITERAL dataset.
在各種解決方案中是以平均準(zhǔn)確率(AA2021)衡量的性能在會(huì)話之間是異構(gòu)的,而在訓(xùn)練、驗(yàn)證和測(cè)試數(shù)據(jù)集上的AA2021的排名對(duì)于這里考慮的所有3個(gè)解決方案都是相似的(圖3)。似乎一個(gè)獲取會(huì)話的復(fù)雜程度取決于它的內(nèi)部特征,所有解決方案在相同的會(huì)話中都是比較困難的。然而,GWC_2021總是優(yōu)于其他解決方案,除了Terraref_2和NAU_3會(huì)話。相反,基線解決方案的AA2021值總是低于2個(gè)獲勝解決方案。GWC_2020方案的AA2021值普遍低于GWC_21,除了少部分會(huì)話包括Terraref 2和NAU 3。
Fig. 3. Detailed performance of the best solutions against the baseline. Extreme domain results are indicated by text. Top: Accuracy per domain; center: FPR; bottom: FNR.
另外本研究還計(jì)算每個(gè)解決方案的穗部計(jì)數(shù)的訓(xùn)練、驗(yàn)證和測(cè)試分割的rRMSE。結(jié)果表明:rRMSE在不同的方案中變化很大,從0.66到2.15(圖6)。對(duì)rRMSE進(jìn)行更詳細(xì)的檢查解與數(shù)據(jù)集分割的函數(shù)(圖6)表明,正如預(yù)期的那樣,訓(xùn)練數(shù)據(jù)集的rRMSE總是最低的除了GWC_2020之外沒有異常值的值。這說明所有的解決方案都能夠?qū)W習(xí)到幾次訓(xùn)練只有很小的差別3模型。的驗(yàn)證數(shù)據(jù)集上的性能超參數(shù)調(diào)優(yōu)和偽標(biāo)記顯著退化,基線和GWC_2021解決方案的異常值很大。驗(yàn)證數(shù)據(jù)集的UQ_2會(huì)話顯示基線和GWC_2021解決方案的最大離群值。
Fig. 6. Distribution of the rRMSE per session grouped per dataset split (Train, Validation, and Test) and solutions (Baseline, GWC_2020, and GWC_2021). The middle gray line indicates the median and the blue box the 25% to 75% quantiles. The whiskers extend to the most extreme (1% to 99% assuming a normal distribution), while the diamonds correspond to outliers. The diamonds at the top indicates outliers larger than rRMSE = 1, the rRMSE value being indicated in parentheses.
2020年和2021年的全球小麥挑戰(zhàn)賽是從高分辨率RGB圖像進(jìn)行麥穗監(jiān)測(cè)的重要步驟。2020年和2021年全球小麥挑戰(zhàn)賽吸引了人們植物表型問題更廣泛的關(guān)注,包括專門從事圖像的社區(qū)基于人工智能算法的處理。全球小麥挑戰(zhàn)的結(jié)果(2020年和2021年)在小麥檢測(cè)和密度估計(jì)領(lǐng)域提供了有價(jià)值的洞察挑戰(zhàn)。對(duì)于提高跨不同領(lǐng)域的發(fā)展植物發(fā)育、器官分割和生長階段評(píng)估新技術(shù)具有重要意義。
論文鏈接:
https://doi.org/10.34133/plantphenomics.0059
——推薦閱讀——
Generating 3D multispectral point clouds of plants with fusion of snapshot spectral and RGB-D images
https://doi.org/10.34133/plantphenomics.0040
Plant Phenomics | 浙江大學(xué)發(fā)現(xiàn)一種融合快照光譜圖像和RGB-D圖像生成高質(zhì)量三維多光譜植物點(diǎn)云的新方法
Analyzing Changes in Maize Leaves Orientation due to GxExM Using an Automatic Method from RGB Images
https://doi/10.34133/plantphenomics.0046
Plant Phenomics | 基于RGB圖像的基因型×環(huán)境型×管理相互作用下的玉米葉片方向變化分析
加入作者交流群
掃碼添加小編微信,拉您進(jìn)入《植物表型組學(xué)》作者交流群,群內(nèi)不定期開展作者分享會(huì)、?l(fā)布會(huì)等高質(zhì)量活動(dòng)。
添加小編微信,備注姓名+單位+PP,加入作者交流群
《植物表型組學(xué)》(Plant Phenomics)是由南京農(nóng)業(yè)大學(xué)和美國科學(xué)促進(jìn)會(huì)(AAAS)合作創(chuàng)辦的英文學(xué)術(shù)期刊,于2019年1月正式上線發(fā)行。采用開放獲取形式,刊載植物表型組學(xué)交叉學(xué)科熱點(diǎn)領(lǐng)域具有突破性科研進(jìn)展的原創(chuàng)性研究論文、綜述、數(shù)據(jù)集和觀點(diǎn)。具體范圍涵蓋高通量表型分析的最新技術(shù),基于圖像分析和機(jī)器學(xué)習(xí)的表型分析研究,提取表型信息的新算法,作物栽培、植物育種和農(nóng)業(yè)實(shí)踐中的表型組學(xué)新應(yīng)用,與植物表型相結(jié)合的分子生物學(xué)、植物生理學(xué)、統(tǒng)計(jì)學(xué)、作物模型和其他組學(xué)研究,表型組學(xué)相關(guān)的植物生物學(xué)等。期刊已被DOAJ、Scopus、PMC、EI和SCIE等數(shù)據(jù)庫收錄。科睿唯安JCR2022影響因子為6.5,位于農(nóng)藝學(xué)、植物科學(xué)、遙感一區(qū)。中科院農(nóng)藝學(xué)、植物科學(xué)一區(qū),遙感二區(qū),生物大類一區(qū)(TOP期刊)。2020年入選中國科技期刊卓越行動(dòng)計(jì)劃高起點(diǎn)新刊項(xiàng)目。
說明:本文由《植物表型組學(xué)》編輯部負(fù)責(zé)組稿。
中文內(nèi)容僅供參考,一切內(nèi)容以英文原版為準(zhǔn)。
排版:張婕(南京農(nóng)業(yè)大學(xué))
審核:孔敏、王平