Predição genômica em ensaios de múltiplos ambientes em milho utilizando abordagens estatística e de aprendizado de máquina

Imagem de Miniatura

Data

2024-03-01

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Viçosa

Resumo

No contexto de ensaios de múltiplos ambientes (MET-multiple environment trials), a predição genômica é proposta como uma ferramenta que permite a predição de híbridos que não foram avaliados em campo, devido à relação captada por marcadores moleculares, com os híbridos avaliados fenotipicamente, economizando tempo, área experimental ou custos em comparação com a fenotipagem. Diversos métodos já foram propostos para as análises de predição genômica em ensaios MET, e o método mais comumente utilizado é o Genomic Best Linear Unbiased Predictor (GBLUP). No entanto, as metodologias de aprendizado de máquina têm ganhado atenção devido a sua capacidade de reconhecer estruturas de interação complexas nos dados. Entre as metodologias de aprendizado de máquina não paramétricas utilizadas na predição genômica podem-se citar as árvores de decisão e seus refinamentos. No entanto, apesar de suas potencialidades, ainda são escassos os estudos que avaliaram como as análises MET podem se beneficiar dessas metodologias. Assim, este estudo teve como objetivo avaliar a predição genômica de híbridos simples de milho não testados em MET para produção de grãos e tempo de florescimento feminino. Além disso, uma aplicação de metodologias de aprendizado de máquina em MET na predição de híbridos e comparamos seu desempenho com o GBLUP modelado para efeitos não aditivos é apresentada. Os resultados destacam que ambas as metodologias são eficientes e podem ser utilizadas em programas de melhoramento de milho para predizer com precisão o desempenho de híbridos em ambientes específicos. A melhor metodologia é caso dependente, especificamente, para explorar o potencial do GBLUP, é importante realizar uma modelagem precisa dos componentes de variância para otimizar a predição de novos híbridos. Por outro lado, as metodologias de aprendizagem de máquina podem capturar efeitos não aditivos sem fazer quaisquer pressuposições quanto ao modelo, já que seus resultados dependem do processo de aprendizado e não da distribuição das variáveis em si. No geral, predizer o desempenho de novos híbridos que não foram avaliados em nenhum ensaio de campo foi mais desafiador do que predizer híbridos em ensaios de campo desbalanceados. Palavras-chave: GBLUP; Boosting; Bagging; Random Forest; Predição Genômica; Zea mays.
In the context of multiple environment trials (MET), genomic prediction is proposed as a tool that allows the prediction of single-cross hybrids that have not been evaluated in the field, due to the molecular markers relationship, with the phenotypically evaluated hybrids, bypassing the problem of sparse test designs, in addition to saving time, experimental area or costs compared to phenotyping. Several methods have been proposed for genomic prediction analyzes in MET assays, and the most commonly used is Genomic Best Linear Unbiased Predictor (GBLUP). However, in recent years, machine learning methodologies have gained attention due to their ability to recognize complex interaction structures in data. Among the non-parametric machine learning methodologies used in genomic selection are decision trees and their refinements. However, despite its potential, there are still few studies that have evaluated how MET analyzes can benefit from these methodologies. Thus, this study aimed to evaluate the genomic prediction of single cross maize hybrids not tested in MET for grain yield and female flowering time. We also aimed to propose an application of machine learning methodologies in MET in the prediction of hybrids and compare their performance with Genomic best linear unbiased prediction (GBLUP) with non-additive effects. Our results highlight that both methodologies are efficient and can be used in maize breeding programs to accurately predict the performance of hybrids in specific environments. The best methodology is case-dependent, specifically, to explore the potential of GBLUP, it is important to perform accurate modeling of the variance components to optimize the prediction of new hybrids. On the other hand, machine learning methodologies can capture non-additive effects without making any assumptions at the outset of the model, as their results depend on the learning process and not on the distribution of the variables themselves. Overall, predicting the performance of new hybrids that were not evaluated in any field trials was more challenging than predicting hybrids in sparse test designs. Keywords: GBLUP; Boosting; Bagging; Random Forest; Genomic Prediction; Zea mays.

Descrição

Palavras-chave

Genômica - Métodos estatísticos, BLUP, Amostragem (Estatística), Aprendizado do computador, Zea mays

Citação

BARRETO, Cynthia Aparecida Valiati. Predição genômica em ensaios de múltiplos ambientes em milho utilizando abordagens estatística e de aprendizado de máquina. 2024. 53 f. Tese (Doutorado em Genética e Melhoramento) - Universidade Federal de Viçosa, Viçosa. 2024.

Avaliação

Revisão

Suplementado Por

Referenciado Por