Estatística Aplicada e Biometria
URI permanente para esta coleçãohttps://locus.ufv.br/handle/123456789/195
Navegar
3 resultados
Resultados da Pesquisa
Item Predição fenômica: uma avaliação de modelos preditivos no melhoramento genético do eucalipto(Universidade Federal de Viçosa, 2025-07-10) Miranda, Taiana Lopes Rangel; Resende, Marcos Deon Vilela de; http://lattes.cnpq.br/0513010608168896O eucalipto ocupa uma posição de destaque na economia brasileira devido, principalmente, às diversas possibilidades de uso de sua madeira, como na produção de celulose, papel, carvão vegetal e geração de energia. Esse estudo teve como objetivo avaliar o desempenho da predição genômica (que se baseia em informações de marcadores moleculares SNPs) e da predição fenômica (Near Infrared Reflectance Spectroscopy – NIRS) em diferentes cenários, para características físicas e químicas da madeira de uma população híbrida (Eucalyptus urophylla x Eucalyptus grandis). Foram genotipados 339 indivíduos para 33.398 marcadores SNPs distribuídos por todo o genoma e rastreados por NIRS com 700 comprimentos de onda. As duas abordagens de predição foram realizadas utilizando os métodos estatísticos: Genomic Best Linear Unbiased Prediction (G-BLUP), Bayesian Ridge Regression (BRR), Bayes B e Bayesian Reproducing Kernel Hilbert Space (B-RKHS). Para avaliar o desempenho dos métodos, foi realizada a validação cruzada 10-fold, visando calcular a média e o desvio padrão da capacidade preditiva e do coeficiente de regressão. A Seleção Fenômica (NIRS) apresentou menor precisão de predição para a maioria das características avaliadas, mas exibiu resultados semelhantes aos obtidos por meio do G-BLUP no cenário em que o número de comprimentos de onda é igual ao número de SNPs. Isso sugere que a predição fenômica (NIRS) pode ser uma alternativa à predição genômica no melhoramento do eucalipto. Palavras-chave: BLUP; seleção genômica; melhoramento de plantas; SNP; NIRSItem Stacking Ensemble Learning para seleção genômica em características complexas(Universidade Federal de Viçosa, 2025-07-09) Celeri, Maurício de Oliveira; Nascimento, Moysés; http://lattes.cnpq.br/2569243563413784A seleção genômica (SG), proposta pela primeira vez por Mewissen et al. em 2001, tem por objetivo estimar os valores genéticos genômicos como uma soma dos efeitos de todos os marcadores distribuídos ao longo do genoma. A possibilidade de reduzir o tempo necessário para desenvolvimento de novas variedades torna a SG um componente primordial em programas de melhoramento. No entanto um ponto crucial na SG é decidir qual método estatísticas será utilizado para estimação dos efeitos de marcadores e, posteriormente, predizer os valores genéticos genômicos de indivíduos não fenotipados. Diversas metodologias foram propostas, como, por exemplo, o GBLUP, as Redes Neurais Artificiais e o alfabeto bayesiano. Em especial para características genéticas quantitativas, alguns métodos podem apresentar limitações devido à complexidade. Recentemente uma classe de modelos de aprendizagem em conjunto vem ganhando destaque nos estudos de seleção e predição genômica: a aprendizagem ensemble, em especial o stacking. Stacking é uma forma usual de método ensemble onde a predição de cada um dos modelos usados na aprendizagem de base é usada como variáveis de entrada para treinar um novo modelo de regressão para a predição final, podendo apresentar maior poder de generalização e representações não lineares. O objetivo deste trabalho é avaliar diferentes configurações para os métodos stacking em predição genômica de características complexas. Para isso, será utilizado um conjunto de dados simulados com 10 características fenotípicas distintas, cada qual com uma arquitetura genética própria. A validação cruzada foi 5-fold e foram testadas diferentes formas de se selecionar os aprendizes de base provindas de modelos como GBLUP, splines de regressão adaptativa multivariada, Bayes A, Bayes A com inclusão de efeitos de dominância, Bayes B, árvore de regressão, bagging, boosting e random forest. Diferentes formas de predição final, escolhidas entre mínimos quadrados ordinários e dos métodos para solução da multicolinearidade: regressão ridge, LASSO, regressão de componentes principais, regressão de fatores e redes neurais artificiais. Os resultados mostram um ganho de até 82,76% na capacidade preditiva quando utilizado as predições de aprendizes de base que apresentaram capacidade preditiva acima da média de capacidades preditivas de treinamento e quando feita a seleção pelo quantil 75% da distribuição das capacidades preditivas. Dentre todos os meta-aprendizes utilizados foi observado que os métodos baseados em redução de dimensionalidade e penalização apresentaram melhores resultados de predição. Palavras-chave: seleção genômica; stacking ensemble learning; efeitos não aditivosItem Random Forest Quantílico aplicado em estudos de seleção genômica(Universidade Federal de Viçosa, 2022-11-04) Valadares, Cristiane Botelho; Nascimento, Moysés; http://lattes.cnpq.br/1899074948442515A seleção genômica ampla (GWS) utiliza marcadores distribuídos por todo o genoma para predizer o valor genético genômico de indivíduos. Esta abordagem possibilita acelerar o processo de melhoramento a partir de seleção precoce e aumentar a precisão de predição dos valores genéticos genômicos. Diversas técnicas estatísticas usadas para predição genômica, tais como RR-BLUP, G-BLUP, Bayes A e Bayes B são baseados em erros e, consequentemente, valores fenotípicos com pressupostos de normalidade. Técnicas de aprendizado de máquina tais como Bagging (BA), Random Forest (RF) e Random Forest Quantílico (QRF) aparecem como modelos alternativos já que não requerem suposições a priori sobre a relação funcional entre marcadores e os valores fenotípicos, sem a necessidade de atender pressuposições sobre as distribuições dos dados e dos resíduos. O QRF, metodologia ainda não explorada no contexto de seleção genômica, é um algoritmo não paramétrico que combina as vantagens do Random Forest (RF) e da Regressão Quantílica (QR). O método determina a distribuição de probabilidade de uma variável resposta e extrai informações de diferentes quantis e não apenas prevê a média. Neste trabalho propõe-se a avaliação do uso do QRF na predição genômica e a comparação de seus resultados com outras técnicas que já vem sendo exploradas em GWS. Neste trabalho dois artigos foram desenvolvidos com essa proposta. No primeiro deles, o objetivo foi avaliar o desempenho do QRF (nos quantis 0,1; 0,3; 0,5; 0,7 e 0,9) na predição dos valores genéticos genômicos para características com arquitetura genética não aditiva (epistasia e dominância). Adicionalmente, as acurácias obtidas foram comparadas com aquelas advindas do G-BLUP (G-BLUP aditivo, G-BLUP aditivo dominante e G-BLUP aditivo epistático). Foi simulada uma população F2 com 1.000 indivíduos genotipados para 4.010 marcadores SNP. Além disso, doze características foram simuladas a partir de um modelo considerando efeitos aditivos e não aditivos, com número de QTL (Quantitative trait loci) variando de oito a 120 e três níveis de herdabilidade (0,3, 0,5 ou 0,8). Em todos os cenários, os resultados da capacidade preditiva do QRF foram iguais ou superiores ao G-BLUP e mostrou ser uma ferramenta alternativa para predizer valores genéticos em características complexas. No segundo trabalho o objetivo foi avaliar o uso do QRF na predição genômica para três características de Coffea arábica e comparar as suas capacidades preditivas com metodologias de machine learning (Bagging e Random Forest), métodos bayesianos (Bayes C𝜋 e Bayes D𝜋) e o G-BLUP. Foram utilizadas as características bicho mineiro, cercosporiose e produção de grãos referentes à 195 indivíduos genotipados com 20.477 marcadores moleculares SNP, resultantes do cruzamento entre Catuaí e Híbrido de Timor, contrastantes em relação à ferrugem do cafeeiro. Os métodos bayesianos apresentaram melhor desempenho para a produção, já o QRF foi igual ou superior aos outros métodos para as características bicho mineiro e cercosporiose, com tempo de processamento muito inferior comparado ao Bayes C𝜋 e Bayes D𝜋. O QRF surge, então, como um algoritmo promissor para predição possibilitando, em alguns cenários, predições mais acuradas de GWS. Palavras-chave: Predição Genômica. Simulação de Dados. Melhoramento Genético do Cafeeiro. Métodos Bayesianos. G-BLUP. Aprendizado de Máquinas.
