Genome wide selection optimization in maize breeding

Imagem de Miniatura

Data

2023-03-31

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Viçosa

Resumo

Maize is a staple crop and the most grown cereal worldwide. The expansion of this crop was possible due to efforts in management and breeding. In the breeding standpoint, advances were achieved in the release of hybrids presenting heterosis, field experimental design and analyses, establishment of heterotic patterns, and effective seed production and marketing. From the last decade on, advances in data analyses benefited from the surge of genotypic data, allowing the prediction of hybrids without being tested through genomic selection approaches. This study aims to convert a high-density SNP data set and use it in a genomic selection or predicting non- tested hybrids and non-observed environments, and for indicating most promising mating parent material for obtaining hybrids and inbred lines for ASI, EPP, FFT, GY, and MFT maize traits. For that, we ranked the SNPs according to their effects from a ME analyses and selected the minimum portion of markers that reached the plateau of prediction accuracy per chromosome, followed by eliminating the repeated markers between traits, and removing the ones tightly linked according to LD analyses. For the GS of hybrids and environments, three methods that comprised GCA and SCA main and interaction effects were fitted, and the prediction accuracy was assessed. The step of selecting parent material was performed according to PS, GS, and GM. The GM methods used the marker effects predicted in the previous GS step, and the 40 top- and bottom-performing crosses and their respective parent lines were selected for each trait. The selected SNPs maintained the accuracy for all traits under drought or well-watered conditions when compared to using full SNP set. For GWS of hybrids, Model 3 performed better for all traits when cross validation schemes had information of all environments (CV1 and CV2) in terms of prediction accuracy, and Model 2 performed better when there was missing information about environments (CV0 and CV00). The mating parents chosen for positive selection were different than the ones from negative selection, ensuring maximization of gains for hybrid and inbred lines development. The highest coincidences of selected parent lines occurred in GS-based methods (Methods 1, 3, 5, 7, 9, 11, 13, and 15), where parents were directly selected based on means or GCA/SCA (and interaction) values of their respective hybrids. The methods based on crosses simulations (Methods 2, 4, 6, 8, 10, 11, 12, 14, and 16) had moderate to low coincidences, but were consistent in indicating the best parent materials overall. GS- and GM-based parent selection results must be further compared to Method 17 (observed crosses) for an effective validation. PS, GS, and GM methods together must help in the decision making of selecting parent material for future crosses. These approaches must be further performed using other training populations. Keywords: Cross-validation. Hybrids. Inbred Lines. Prediction Accuracy. SNP Markers.
O milho é o cereal mais cultivado em todo o mundo. A expansão dessa cultura foi possível devido aos esforços de manejo e melhoramento. Do ponto de vista do melhoramento, avanços foram alcançados na liberação de híbridos com heterose, delineamento e análises experimentais em campo, estabelecimento de padrões heteróticos e produção e comercialização efetiva de sementes. A partir da última década, avanços na análise de dados foram beneficiados pelo surgimento de dados genotípicos, permitindo a predição de híbridos sem serem testados por meio de abordagens de seleção genômica. Este estudo tem como objetivo converter um conjunto de dados de SNP de alta densidade e usá-lo em seleção genômica para predizer híbridos não testados e ambientes não observados, e indicar o material parental de acasalamento mais promissor para a obtenção de híbridos e linhagens para os caracteres ASI, EPP, FFT, GY e MFT em milho. Para isso, SNPs foram classificadas de acordo com seus efeitos estimados, e uma porção mínima de marcadores que atingiram o platô de acurácia de predição por cromossomo foram selecionados, seguida de uma eliminação de marcadores repetidos entre as características e remoção daqueles ligados de acordo com uma análise de LD. Para a GWS de híbridos e ambientes, três modelos que compreenderam os efeitos principais e de interação de GCA e SCA foram ajustados e a acurácia de predição foi avaliada. A etapa de seleção do material de parental foi realizada de acordo com PS, GS e GM. Os métodos de GM usaram os efeitos de marcadores preditos na etapa anterior de GS, e os 40 cruzamentos de desempenho superior e inferior e suas respectivas linhagens parentais foram selecionados para cada característica. Os SNPs selecionados mantiveram a acurácia de predição para todas as características em condição de déficit hídrico e irrigação, quando comparado ao uso de todos os marcadores disponíveis. Para GS de híbridos, o Modelo 3 teve melhor desempenho para todas as características quando os esquemas de validação cruzada tinham informações de todos os ambientes (CV1 e CV2) em termos acurácia, e o Modelo 2 teve melhor desempenho quando faltavam informações sobre os ambientes (CV0 e CV00). Os genitores escolhidos para seleção positiva foram diferentes dos genitores para seleção negativa, garantindo a maximização dos ganhos para o desenvolvimento de híbridos e linhagens endogâmicas. As maiores coincidências de linhagens parentais selecionadas ocorreram em métodos baseados em GS (Métodos 1, 3, 5, 7, 9, 11, 13 e 15), onde os pais foram selecionados diretamente com base em médias ou valores de GCA/SCA (e interação) de seus respectivos híbridos. Os métodos baseados em simulações de cruzamentos (Métodos 2, 4, 6, 8, 10, 11, 12, 14 e 16) tiveram coincidências moderadas a baixas, mas foram consistentes em indicar os melhores materiais de parentais em geral. Os resultados da seleção de pais baseados em GS e GM devem ser comparados com o Método 17 (cruzamentos observados) para uma validação eficaz. Os métodos PS, GS e GM juntos devem ajudar na tomada de decisão de seleção de material parental para futuros cruzamentos. Palavras-chave: Acurácia de Predição. Híbridos. Linhagens Endogâmicas. Marcadores SNP. Validação Cruzada.

Descrição

Palavras-chave

Milho - Melhoramento genético, Milho - Seleção, Marcadores genéticos, Milho híbrido

Citação

BERNARDELI, Arthur Martins Almeida. Genome wide selection optimization in maize breeding. 2023.73 f. Tese (Doutorado em Genética e Melhoramento) - Universidade Federal de Viçosa, Viçosa. 2023.

Avaliação

Revisão

Suplementado Por

Referenciado Por