Use este identificador para citar ou linkar para este item: https://locus.ufv.br//handle/123456789/28766
Tipo: Tese
Título: Eficiência preditiva de técnicas de inteligência computacional em função da complexidade de caracteres sob controle de genes com efeito epistático
Predictive efficiency of computational intelligence techniques as a function of the complexity of characters under control of genes with epistatic effect
Autor(es): Barbosa, Ivan de Paiva
Abstract: Diante dos desafios enfrentados pelos melhoristas de plantas para seleção de indivíduos superiores, a seleção genômica ampla (Genome Wide Selection - GWS) é uma técnica que têm ganhado destaque. A GWS consiste na utilização de um grande número de marcadores moleculares para a predição de valores genéticos e têm se mostrado altamente relevante para o melhoramento genético. Na elaboração do projeto desta pesquisa, duas questões básicas foram formuladas. A primeira é que métodos diferentes proporcionariam resultados diferentes e segundo é que a complexidade da característica analisada poderia influenciar no desempenho das técnicas. Para isso, as análises foram divididas em dois artigos. No primeiro artigo, o objetivo foi avaliar e comparar o desempenho preditivo de métodos estatísticos (RR- Blup e BayesB) e métodos de inteligência computacional, MLP (Multilayer Perceptron) e RBF (Radial Basis Function), e aprendizado de máquina, árvore de regressão com refinamentos BO (Boosting), BA (Bagging) e RF (Random Forest) por meio de GWS em populações simuladas, com características apresentando diferentes níveis de herdabilidade e números de QTL (Quantitative Trait Loci), na presença de dominância e efeitos epistáticos. Já segundo artigo, os níveis de alguns cenários foram reduzidos e novos cenários de complexidade foram assumidos, e o objetivo foi comparar o desempenho seletivo e preditivo do RR-BLUP (Random Regression Best Linear Unbiased Predictor) e métodos de inteligência computacional, MLP (Multilayer Perceptron) e RBF (Radial Basis Function), e aprendizado de máquina, árvore de regressão com refinamentos BO (Boosting), BA (Bagging) e RF (Random Forest), em populações simuladas para diferentes cenários em relação ao número de QTL, à distribuição dos QTL nos grupos de ligação (GL), ao grau médio de dominância, à herdabilidade e aos diferentes modelos de expressão aditivo e não aditivos. Para ambos os artigos, o genoma simulado compreendeu 2010 SNP (Single Nucleotide Polymorphism) e distribuídos equitativamente em 10 grupos de ligação. Os métodos RBF, RF e Bagging, de uma maneira, geral apresentaram bons e consistentes resultados de R² e REQM. Esses métodos apresentaram resultados iguais ou superiores à média geral dos métodos para todos os cenários avaliados. O aumento no número de QTL, até 88 para a configuração do genoma simulado, afetou positivamente os resultados de R² e REQM. A presença de efeito de dominância e a baixa herdabilidade provocou impactos negativos para os resultados de R² e REQM. Todos os métodos apresentaram uma redução no R² e aumento na REQM quando efeitos não aditivos eram importantes para a característica. Assim, nenhum método foi excepcionalmente eficiente para a captura deste efeito. A distribuição dos QTL nos GL foi o único cenário que afetou os resultados de R² e REQM de modo variado. Neste cenário os melhores resultados de R², foram observados quando os QTL estavam distribuídos em apenas um GL, enquanto que para os resultados de REQM os melhores resultados foram obtidos quando os QTL foram distribuídos em oito GL. Esse resultado mostra que a forma de distribuição dos QTL no genoma pode ser o principal atributo a ser avaliado quanto ao interesse na seleção ou na predição dos valores genéticos pelo melhorista. Os métodos de de inteligência computacional e aprendizado de máquina demonstram ser ferramentas poderosas para prever valores genéticos com controle de gene epistático, em características com diferentes graus de herdabilidade e diferentes números de genes de controle. Palavras-chave: Inteligência Computacional. Predição. GWS. Seleção Genômica.
Given the challenges faced by plant breeders to select superior individuals, genomic wide selection (GWS) is a technique that has gained prominence. GWS consists of the use of a large number of molecular markers for the prediction of genetic values and is highly relevant for genetic improvement. In the elaboration of this research project, two basic questions were formulated. The first is that different methods would provide different results and the second is that the complexity of the analyzed characteristic could influence the performance of the techniques. For this, the analyzes were divided into two articles. In the first article, the objective was to evaluate and compare the predictive performance of statistical methods (RR-Blup and BayesB) and computational intelligence methods, MLP (Multilayer Perceptron) and RBF (Radial Basis Function), and machine learning, Regression Tree with refinements BO (Boosting), BA (Bagging), and RF (Random Forest) through GWS in simulated populations, with characteristics presenting different levels of heritability and QTL (Quantitative Trait Loci) numbers, in the presence of dominance and effects epistatic. According to the article, the levels of some scenarios were reduced and new complexity scenarios were assumed, and the objective was to compare the selective and predictive performance of RR-BLUP (Random Regression Best Linear Unbiased Predictor) and computational intelligence methods, MLP (Multilayer Perceptron) and RBF (Radial Basis Function), and machine learning, Regression Tree with BO (Boosting), BA (Bagging) and RF (Random Forest) refinements, in simulated populations for different scenarios in relation to the number of QTL, the distribution of the QTL in the linkage groups (GL), the average degree of dominance, the heritability and the different additive and non-additive expression models. For both articles, the simulated genome comprised 2010 SNP (Single Nucleotide Polymorphism) and was evenly distributed into 10 linkage groups. The RBF, RF, and Bagging methods, in general, presented good and consistent results for R² and RMSE. These methods showed results equal to or higher than the general mean of the methods for all evaluated scenarios. The increase in the number of QTL, up to 88 for the simulated genome configuration, positively affected the results of R² and RMSE. The presence of dominance effect and low heritability caused negative impacts on the results of R² and REQM. All methods showed a reduction in R² and an increase in RMSE when non-additive effects were important for the trait. Thus, no method was exceptionally efficient for capturing this effect. The distribution of QTL in GL was the only scenario that affected the R² and RMSE results in different ways. In this scenario, the best R² results were observed when the QTL were distributed in only one GL, while for the RMSE results the best results were obtained when the QTL were distributed in eight GL. This result shows that the form of distribution of QTL in the genome can be the main attribute to be evaluated regarding the interest in the selection or prediction of genetic values by the breeder. Computer intelligence and machine learning methods prove to be powerful tools for predicting genetic values with epistatic gene control, in traits with different degrees of heritability and different numbers of control genes. Keywords: Computational Intelligence. Prediction. GWS. Genomic Selection.
Palavras-chave: Plantas - Melhoramento genético
Inteligência computacional
Predição
CNPq: Genética Quantitativa
Editor: Universidade Federal de Viçosa
Titulação: Doutor em Genética e Melhoramento
Citação: BARBOSA, Ivan de Paiva. Eficiência preditiva de técnicas de inteligência computacional em função da complexidade de caracteres sob controle de genes com efeito epistático. 2021. 95 f. Tese (Doutorado em Genética e Melhoramento) - Universidade Federal de Viçosa, Viçosa. 2021.
Tipo de Acesso: Acesso Aberto
URI: https://locus.ufv.br//handle/123456789/28766
Data do documento: 29-Jul-2021
Aparece nas coleções:Genética e Melhoramento

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
texto completo.pdftexto completo4,13 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.