Determination of wheat seed quality in the presence of Fusarium graminearum using near-infrared spectroscopy combined with machine learning technique
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Universidade Federal de Viçosa
Abstract
Wheat is a key global crop that significantly contributes to food security. In Brazil, approximately 50% of wheat consumption relies on imports, making the increase in domestic production a priority. Expanding wheat cultivation necessitates the use of high-quality seeds, with seed health being critical due to the presence of various pathogens. Among these, Fusarium graminearum, the causative agent of Fusarium head blight (FHB), is known to reduce seed germination and vigor, thereby affecting field establishment. Near-infrared (NIR) spectroscopy, combined with machine learning technique, offers a non-destructive method for assessing seed quality. However, the effectiveness of this approach depends on the appropriate data preprocessing methods. This study aimed to evaluate different preprocessing techniques to determine the quality of wheat seeds infected by F. graminearum and to assess the application of the second derivative of Savitzky-Golay as a preprocessing method across four datasets derived from final germination percentage, seedling growth, emergence, and blotter tests. Two wheat cultivars were grown in a greenhouse and inoculated with F. graminearum at three stages: anthesis, early milk, and early dough. Following the crop cycle, individual seeds were harvested and analyzed using NIR spectroscopy. The seeds then underwent quality tests to classify each spectrum. The datasets were preprocessed, and the Partial Least Squares Discriminant Analysis (PLS-DA) algorithm was used to classify the seeds. Each model was evaluated using multiple performance metrics to assess its classification capability, and key wavelength regions that contributed to class separation were identified. The findings indicated that binary classification models outperformed three-class models, regardless of the preprocessing method used. Models based on growth tests exhibited lower performance across all preprocessing methods. The spectral regions of 1000-1300 nm and 1800-2000 nm were consistently important for class separation across different seed quality tests. These regions could be utilized in seed quality control programs employing NIR spectroscopy for non-destructive analysis. Additionally, the study highlighted the importance of using diverse metrics to ensure robust results, particularly in cases of imbalanced datasets. Keywords: preprocessing; accuracy ; wheat scab; pls-da.
O trigo é uma cultura de extrema importância para a segurança alimentar global. No Brasil, aproximadamente 50% do consumo de trigo depende de importações, tornando o aumento da produção doméstica uma prioridade. A expansão da área cultivada com trigo exige o uso de sementes de alta qualidade, sendo a sanidade das sementes fundamental devido à presença de vários patógenos. Entre esses, Fusarium graminearum, o agente causador da giberela (FHB), é conhecido por reduzir a germinação e o vigor das sementes, afetando o estabelecimento no campo. A espectroscopia no infravermelho próximo (NIR), combinada com técnica de aprendizado de máquina, oferece um método não destrutivo para avaliar a qualidade das sementes. No entanto, a eficiência da técnica depende dos métodos apropriados de pré-processamento dos dados. Este estudo teve como objetivo avaliar diferentes técnicas de pré-processamento para determinar a qualidade das sementes de trigo infectadas por F. graminearum e avaliar a aplicação da segunda derivada de Savitzky-Golay como método de pré-processamento em quatro conjuntos de dados derivados dos testes de germinação, crescimento de plântulas, emergência e teste de Blotter. Duas cultivares de trigo foram cultivadas em casa de vegetação e inoculadas com F. graminearum em três estágios: antese, grão leitoso e grão pastoso. Após o ciclo da cultura, sementes individuais foram colhidas e analisadas por espectroscopia NIR. Em seguida, as mesmas sementes foram submetidas a análise de germinação e vigor para obtenção da respectiva classe para compor o arquivo de dados. Os conjuntos de dados foram pré-processados, e o algoritmo de Análise Discriminante de Mínimos Quadrados Parciais (PLS-DA) foi utilizado para classificar as sementes. Cada modelo foi avaliado usando múltiplas métricas de desempenho para verificar sua capacidade de classificação, e as principais regiões de comprimento de onda que contribuíram para a separação das classes foram identificadas. Os resultados indicaram que modelos de classificação binária superaram os modelos de três classes, independentemente do método de pré- processamento utilizado. Os modelos baseados em testes de crescimento apresentaram menor desempenho em todos os métodos de pré-processamento. As regiões espectrais de 1000-1300 nm e 1800-2000 nm foram consistentemente importantes para a separação das classes em diferentes testes de qualidade de sementes. Essas regiões poderiam ser utilizadas em programas de controle de qualidade de sementes que empregam espectroscopia NIR para análise não destrutiva. Além disso, o estudo destacou a importância do uso de diferentes métricas para garantir resultados robustos, especialmente em casos de conjuntos de dados desbalanceados. Palavras-chave: pré-processamento; acurácia; giberela; pls-da.
O trigo é uma cultura de extrema importância para a segurança alimentar global. No Brasil, aproximadamente 50% do consumo de trigo depende de importações, tornando o aumento da produção doméstica uma prioridade. A expansão da área cultivada com trigo exige o uso de sementes de alta qualidade, sendo a sanidade das sementes fundamental devido à presença de vários patógenos. Entre esses, Fusarium graminearum, o agente causador da giberela (FHB), é conhecido por reduzir a germinação e o vigor das sementes, afetando o estabelecimento no campo. A espectroscopia no infravermelho próximo (NIR), combinada com técnica de aprendizado de máquina, oferece um método não destrutivo para avaliar a qualidade das sementes. No entanto, a eficiência da técnica depende dos métodos apropriados de pré-processamento dos dados. Este estudo teve como objetivo avaliar diferentes técnicas de pré-processamento para determinar a qualidade das sementes de trigo infectadas por F. graminearum e avaliar a aplicação da segunda derivada de Savitzky-Golay como método de pré-processamento em quatro conjuntos de dados derivados dos testes de germinação, crescimento de plântulas, emergência e teste de Blotter. Duas cultivares de trigo foram cultivadas em casa de vegetação e inoculadas com F. graminearum em três estágios: antese, grão leitoso e grão pastoso. Após o ciclo da cultura, sementes individuais foram colhidas e analisadas por espectroscopia NIR. Em seguida, as mesmas sementes foram submetidas a análise de germinação e vigor para obtenção da respectiva classe para compor o arquivo de dados. Os conjuntos de dados foram pré-processados, e o algoritmo de Análise Discriminante de Mínimos Quadrados Parciais (PLS-DA) foi utilizado para classificar as sementes. Cada modelo foi avaliado usando múltiplas métricas de desempenho para verificar sua capacidade de classificação, e as principais regiões de comprimento de onda que contribuíram para a separação das classes foram identificadas. Os resultados indicaram que modelos de classificação binária superaram os modelos de três classes, independentemente do método de pré- processamento utilizado. Os modelos baseados em testes de crescimento apresentaram menor desempenho em todos os métodos de pré-processamento. As regiões espectrais de 1000-1300 nm e 1800-2000 nm foram consistentemente importantes para a separação das classes em diferentes testes de qualidade de sementes. Essas regiões poderiam ser utilizadas em programas de controle de qualidade de sementes que empregam espectroscopia NIR para análise não destrutiva. Além disso, o estudo destacou a importância do uso de diferentes métricas para garantir resultados robustos, especialmente em casos de conjuntos de dados desbalanceados. Palavras-chave: pré-processamento; acurácia; giberela; pls-da.
Description
Citation
SILVA, José Maria da. Determination of wheat seed quality in the presence of Fusarium graminearum using near-infrared spectroscopy combined with machine learning technique. 2024. 96 f. Tese (Doutorado em Fitotecnia) - Universidade Federal de Viçosa, Viçosa. 2024.
