Estatística Aplicada e Biometria
URI permanente para esta coleçãohttps://locus.ufv.br/handle/123456789/195
Navegar
3 resultados
Resultados da Pesquisa
Item Predictive methods using pedigrees, markers, and images for the genetic improvement of sugarcane(Universidade Federal de Viçosa, 2024-09-23) Gonçalves, Mateus Teles Vital; Peternelli, Luiz Alexandre; http://lattes.cnpq.br/3146419064245272The overall objective of this thesis was to assess predictive methods that leverage different sources of information, to improve genetic evaluation of sugarcane genotypes. The plant material and experimental data used consisted of early-generation field trials conducted by the genetic breeding program of the Universidade Federal de Viçosa (PMGCA). In the first chapter I discussed the content, introducing research questions and the main objectives of this thesis. In the second chapter, we compared pedigree- based best linear unbiased prediction (PBLUP), genomic-based (GBLUP), and single- step (ssGBLUP) models for the genetic evaluation of a sugarcane population in which only a subset of individuals was genotyped. Models were evaluated in two cross- validation (CV) schemes: validation using genotyped individuals (CV1) and validation using nongenotyped individuals (CV2). Our results suggest that genetic evaluation us- ing the ssGBLUP models may be an alternative approach for sugarcane. Also, results showed that models including only pedigree information gave relatively high prediction accuracies, suggesting that pedigrees are an important source of genetic information, particularly for sugarcane and other crop species with complex polyploid genomes. In the third chapter, we evaluated the integration of unoccupied aerial systems (UAS)- based red-green-blue (RGB) imaging with pedigree and genomic prediction models to improve selection accuracy for tonnes of cane per hectare (TCH). The objectives were to estimate genetic parameters and trends for TCH and RGB-image extracted traits, and to compare the performance of single-trait with multi-trait genomic and pedigree prediction models that incorporate RGB-image extracted traits. The performance of models was evaluated in terms of Pearson’s correlation between adjusted and predicted phenotypes, and mean squared error (MSE) using three cross-validation schemes, which varied in the level of phenotypic information available: ST, without secondary traits; MT-1, secondary traits in the training set; and MT-2, secondary traits in both, training and testing sets. We used data of an augmented block design trial, consisting of 385 clones. Clones were phenotyped at the second ratoon stage for TCH, and for 12 RGB-image extracted traits collected in a single flight. In general, we found low genetic correlation between TCH and RGB-image extracted traits, and moderate narrow-sense heritability estimates for RGB-image extracted traits. Overall indirect response to selection of RGB-image extracted traits was higher compared to direct response to selection for TCH. Our results suggest that accuracies of multi-trait models that incorporated RGB- image extracted traits did not improve compared to single-trait models for predicting TCH. Future research should investigate alternative sensor technologies and optimize UAS-based data collection. Keywords: RGB; Single-step models; Multi-trait models; Polyploid; Saccharum spp.; Genomic prediction.Item Redes neurais regularizadas na predição de características agronômicas de soja(Universidade Federal de Viçosa, 2024-04-03) Costa, Noé Mitterhofer Eiterer Ponce de Leon da; Nascimento, Moysés; http://lattes.cnpq.br/9184271760739064Um dos métodos de aprendizado de máquina utilizado atualmente na Seleção Genômica (SG) são as Redes Neurais Artificiais (RNAs) e, dentre estas, a Rede Perceptron de Múltiplas Camadas (PMC). O PMC destaca-se na solução de problemas de classificação ou regressão pelo fato de não exigir um modelo funcional, nem de atender pressuposições e não requerer conhecimento a priori sobre o fenômeno em estudo. No entanto, um problema comum nas PMC é o overfitting, que se trata de um superajustamento da rede aos dados de treinamento. Nestes casos, o modelo não possui capacidade de generalização fazendo que ele seja menos eficaz nas predições em um novo conjunto de dados ou no conjunto de teste. Para contornar este problema, algumas alternativas são as regularizações L1 e L2, que se baseiam nas regressões em penalizações similares aos métodos Lasso e Ridge, respectivamente. O objetivo deste estudo foi avaliar a eficiência do uso da regularização em modelos de PMC aplicados na predição genômica. Além disso, os resultados obtidos foram comparados com outros utilizados em predição genômica, tais como o Perceptron de Múltiplas Camadas (PMC), Árvore de Decisão (AD), Random Forest (RF), Bagging (BAG), Boosting (BOO) e Genomic Best Linear Unbiased Prediction (GBLUP). Os dados são provenientes de 100 genótipos de soja, em um experimento conduzido de setembro a novembro de 2021, no delineamento em blocos ao acaso com três repetições, em que cada parcela foi constituída de uma planta cultivada em um vaso dentro de uma casa de vegetação. Foram avaliadas as características diâmetro de hipocótilo (DH, em milímetros), altura de planta (AP, em centímetros), comprimento total de raiz (CR, em centímetros) e área superficial projetada de raiz (AR, em centímetros quadrados). Na avaliação do PMC regularizado (PMCR), foram utilizados as medidas de capacidade preditiva (CP) e raiz do erro quadrático médio (RMSE) para comparação dos métodos. Em geral, o PMC com regularização L2 melhorou o desempenho em comparação com métodos avaliados em termos de CP e RMSE. Os valores de CP obtidos pelas redes regularizadas L2 foram melhores que todos os métodos avaliados. Especificamente, quando comparado com o segundo o melhor método, os ganhos em termos de CP foram de 6,05%, 25,86%, 32,90% e 0,16% para as características, respectivamente, AP, DH, CR e AR. Já em termos de RMSE, o PMCR apresentou resultados inferiores e desejáveis em 10,81%, 15,00%, 13,62% e 20,41% para as características AP, DH, CR e AR, respectivamente, quando comparado com as redes sem regularização. Quando a comparação é entre todas as metodologias comparativas, o GBLUP obteve o menor valor de RMSE para todas características avaliadas. Palavras-chave: Capacidade Preditiva. Machine Learning. Predição Genômica.Item Seleção de marcadores utilizando probabilidade a posteriori de inclusão no modelo para predição genômica(Universidade Federal de Viçosa, 2023-07-18) Begnami, Vinicius Silva; Azevedo, Camila Ferreira; http://lattes.cnpq.br/3707637931879411Com o aumento constante da população mundial, a demanda por alimentos está crescendo diariamente, embora as áreas agricultáveis estejam chegando ao seu limite territorial. Uma solução para enfrentar esse desafio é a aplicação do melhoramento genético, que ganha cada vez mais destaque devido à sua capacidade de aumentar a produtividade e melhorar a qualidade dos alimentos em uma área de cultivo limitada. Com os avanços na genética molecular, é possível obter informações genéticas diretamente do DNA por meio de marcadores moleculares, especialmente os SNP (Single Nucleotide Polimorphism), que têm sido utilizados em estudos de Seleção Genômica Ampla (GWS, Genome Wide Selection). A GWS busca estimar os valores genéticos genômicos (GEBV, Genomic Estimated Breeding Value) dos indivíduos com base em informações genotípicas. No entanto, ao ajustar o modelo de predição, a alta dimensionalidade e multicolinearidade representam desafios, uma vez que o número de marcadores é muito superior ao número de indivíduos avaliados. Como nem todos os marcadores do genoma influenciam uma característica fenotípica específica, é comum realizar uma seleção prévia desses marcadores. Neste contexto, este estudo propõe a seleção os marcadores mais relevantes para a predição genômica com base em sua probabilidade de inclusão. Para atingir esse objetivo, a dissertação foi dividida em dois capítulos. O Capítulo 1 consiste em uma revisão de literatura sobre as metodologias estatísticas que serão aplicadas no próximo capítulo. O Capítulo 2 tem como principal objetivo a seleção dos marcadores mais relevantes a partir de um conjunto de dados reais originários do arroz Oryza Sativa. Este conjunto de dados contém 413 acessos genotipados para 44.100 marcadores do tipo SNP. A seleção dos marcadores é realizada com base na probabilidade a posteriori de inclusão, com cálculos apoiados na matriz de efeitos dos marcadores moleculares, estimados por meio do método BayesDπ, e no número total de iterações salvas. Após a seleção dos marcadores mais relevantes, eles são agrupados em conjuntos de 2.000, 4.000, 6.000, ..., até 36.901, de acordo com sua importância. Em seguida, cada grupo tem seu efeito estimado pelo método BayesA, e a capacidade preditiva do modelo de predição é calculada. Essa métrica é comparada com a capacidade preditiva dos modelos de predição ajustados pelos métodos bayesianos BayesA e BayesD𝜋, quando aplicados separadamente e sem a prévia seleção dos marcadores. Os resultados obtidos indicam que a seleção de marcadores mais relevantes para a predição genômica se mostra eficaz, com alta capacidade preditiva em comparação aos métodos BayesA e BayesD𝜋 quando usados isoladamente e sem a prévia seleção. Além disso, a probabilidade a posteriori de inclusão também demonstrou ser eficaz na compreensão da arquitetura genética da característica em estudo. Assim, a seleção de marcadores contribui para a redução da alta dimensionalidade, o aumento da capacidade preditiva do modelo de predição genômica e a redução do esforço computacional, abordando problemas recorrentes na seleção genômica. Palavras-chave: Marcadores Moleculares. Arroz. Seleção Genômica. Genética. Melhoramento Genético.