Statistical genetics tools for empowered data-driven decisions

Imagem de Miniatura

Data

2024-03-18

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Viçosa

Resumo

The pressure to accelerate results in plant breeding programs is intensifying. Conversely, there is a concerning decline in the genetic diversity of staple crops, making it increasingly difficult to achieve genetic gains. Consequently, efficient resource allocation within breeding programs requires the strategic implementation of statistical genetics tools. This shift necessitates data-driven decision-making, placing professionals proficient in this toolkit at a significant advantage for addressing both traditional and emerging challenges. This thesis serves as a practical demonstration of utilizing statistical genetics in various plant breeding endeavours. Divided into six chapters, each with distinct objectives, the work showcases a range of applications. In Chapter 1, we determined the optimal number of harvests for selection in cacao breeding, considering both recommendation and recombination. Chapter 2 explores the application of covariance structure modelling in two common scenarios of perennial plant breeding: multi-harvest and multi-site data analysis. Chapter 3 demonstrates the use of factor analytic mixed models in maize breeding, including the incorporation of selection tools for streamlined decision-making. Notably, this chapter highlights the advantage of seasonal selection for achieving greater genetic gains compared to a combined approach. In Chapter 4, we evaluated the efficacy of the reciprocal recurrent selection (RRS) scheme within a eucalyptus breeding program. This chapter acknowledges the extended timeframe associated with RRS but also demonstrates its success in enhancing the hybrid population. Additionally, the chapter emphasizes the importance of considering dominance effects during the selection process. Chapter 5 offers a comprehensive tutorial on conducting linear mixed model analyses in perennial plant breeding. The chapter covers various analyses, including individual trials, multi- environment trials, spatial analysis, and competition analysis. Finally, Chapter 6 introduces the R package ProbBreed, which utilizes Bayesian principles and probabilistic concepts to support selection in multi-environment trials. ProbBreed estimates the risk associated with selecting candidates, empowering more informed decision-making. This chapter also introduces a novel multi-location-year model and compares the outcomes of ProbBreed and ASReml-R using simulated data. By showcasing the applications of statistical genetics tools and facilitating knowledge sharing through open-source code and reproducible examples, this thesis emphasizes the versatility and importance of this field in tackling diverse challenges within the dynamic field of plant breeding. Keywords: Data Analysis. Linear Mixed Models. Bayesian models. Genotype-by-Environment interaction. Spatial Analysis. Reciprocal Recurrent Selection
A pressão para acelerar os resultados dos programas de melhoramento de plantas está a intensificar-se. Em contraste, há um declínio preocupante na diversidade genética das principais culturas, tornando cada vez mais difícil obter ganhos genéticos consistentes. Consequentemente, a alocação eficiente de recursos nos programas de melhoramento requer a implementação estratégica de ferramentas de genética-estatística. Esta mudança exige uma tomada de decisão baseada em dados, colocando os profissionais proficientes neste conjunto de ferramentas numa vantagem significativa para enfrentar desafios tradicionais e emergentes. Esta tese serve como uma demonstração prática da utilização da genética-estatística em várias vertentes dod melhoramento de plantas. Dividido em seis capítulos, cada um com objetivos distintos, o trabalho apresenta uma gama de aplicações. No Capítulo 1 determinamos o número ideal de colheitas para seleção no melhoramento de cacau, considerando recomendação e recombinação. O Capítulo 2 explora a aplicação da modelagem de estrutura de covariância em dois cenários comuns de melhoramento de plantas perenes: análise de dados de múltiplas colheitas e de múltiplos locais. O Capítulo 3 demonstra o uso de modelos fator analítico no melhoramento de milho, incluindo a incorporação de ferramentas de seleção para agilizar a tomada de decisões. Notavelmente, este capítulo destaca a vantagem da seleção sazonal para alcançar maiores ganhos genéticos em comparação com uma abordagem combinada. No Capítulo 4 avaliamos a eficácia do esquema de seleção recorrente recíproca (SRR) dentro de um programa de melhoramento genético de eucalipto. Este capítulo reconhece o prazo alargado associado ao SRR, mas também demonstra o seu sucesso no aumento da população híbrida. Além disso, o capítulo enfatiza a importância de considerar os efeitos de dominância durante o processo de seleção. O Capítulo 5 oferece um tutorial abrangente sobre a condução de análises baseadas em modelos lineares mistos no melhoramento de plantas perenes. O capítulo cobre várias análises, incluindo ensaios individuais, ensaios multiambientais, análise espacial e análise de concorrência. Finalmente, o Capítulo 6 apresenta o pacote do R ProbBreed, que utiliza princípios bayesianos e conceitos probabilísticos para apoiar a seleção em ensaios multiambientes. ProbBreed estima o risco associado à seleção de candidatos, capacitando uma tomada de decisão mais informada. Este capítulo também apresenta um novo modelo de múltiplos anos e locais e compara os resultados dos pacotes ProbBreed e ASReml-R usando dados simulados. Ao mostrar as aplicações de ferramentas de genética-estatística e facilitar o compartilhamento de conhecimento através de códigos e exemplos reproduzíveis, esta tese enfatiza a versatilidade e a importância deste campo no enfrentamento de diversos desafios no dinâmico campo do melhoramento de plantas. Palavras-chave: Análise de dados. Modelos Lineares Mistos. Modelos Bayesianos. Interação Genótipos-Ambientes. Análise Espacial. Seleção Recorrente Recíproca

Descrição

Palavras-chave

Plantas - Melhoramento genético, Genética quantitativa

Citação

CHAVES, Saulo Fabrício da Silva. Statistical genetics tools for empowered data-driven decisions. 2024. 208 f. Tese (Doutorado em Genética e Melhoramento) - Universidade Federal de Viçosa, Viçosa. 2024.

Avaliação

Revisão

Suplementado Por

Referenciado Por