Estatística Aplicada e Biometria
URI permanente para esta coleçãohttps://locus.ufv.br/handle/123456789/195
Navegar
2 resultados
Resultados da Pesquisa
Item Random Forest Quantílico aplicado em estudos de seleção genômica(Universidade Federal de Viçosa, 2022-11-04) Valadares, Cristiane Botelho; Nascimento, Moysés; http://lattes.cnpq.br/1899074948442515A seleção genômica ampla (GWS) utiliza marcadores distribuídos por todo o genoma para predizer o valor genético genômico de indivíduos. Esta abordagem possibilita acelerar o processo de melhoramento a partir de seleção precoce e aumentar a precisão de predição dos valores genéticos genômicos. Diversas técnicas estatísticas usadas para predição genômica, tais como RR-BLUP, G-BLUP, Bayes A e Bayes B são baseados em erros e, consequentemente, valores fenotípicos com pressupostos de normalidade. Técnicas de aprendizado de máquina tais como Bagging (BA), Random Forest (RF) e Random Forest Quantílico (QRF) aparecem como modelos alternativos já que não requerem suposições a priori sobre a relação funcional entre marcadores e os valores fenotípicos, sem a necessidade de atender pressuposições sobre as distribuições dos dados e dos resíduos. O QRF, metodologia ainda não explorada no contexto de seleção genômica, é um algoritmo não paramétrico que combina as vantagens do Random Forest (RF) e da Regressão Quantílica (QR). O método determina a distribuição de probabilidade de uma variável resposta e extrai informações de diferentes quantis e não apenas prevê a média. Neste trabalho propõe-se a avaliação do uso do QRF na predição genômica e a comparação de seus resultados com outras técnicas que já vem sendo exploradas em GWS. Neste trabalho dois artigos foram desenvolvidos com essa proposta. No primeiro deles, o objetivo foi avaliar o desempenho do QRF (nos quantis 0,1; 0,3; 0,5; 0,7 e 0,9) na predição dos valores genéticos genômicos para características com arquitetura genética não aditiva (epistasia e dominância). Adicionalmente, as acurácias obtidas foram comparadas com aquelas advindas do G-BLUP (G-BLUP aditivo, G-BLUP aditivo dominante e G-BLUP aditivo epistático). Foi simulada uma população F2 com 1.000 indivíduos genotipados para 4.010 marcadores SNP. Além disso, doze características foram simuladas a partir de um modelo considerando efeitos aditivos e não aditivos, com número de QTL (Quantitative trait loci) variando de oito a 120 e três níveis de herdabilidade (0,3, 0,5 ou 0,8). Em todos os cenários, os resultados da capacidade preditiva do QRF foram iguais ou superiores ao G-BLUP e mostrou ser uma ferramenta alternativa para predizer valores genéticos em características complexas. No segundo trabalho o objetivo foi avaliar o uso do QRF na predição genômica para três características de Coffea arábica e comparar as suas capacidades preditivas com metodologias de machine learning (Bagging e Random Forest), métodos bayesianos (Bayes C𝜋 e Bayes D𝜋) e o G-BLUP. Foram utilizadas as características bicho mineiro, cercosporiose e produção de grãos referentes à 195 indivíduos genotipados com 20.477 marcadores moleculares SNP, resultantes do cruzamento entre Catuaí e Híbrido de Timor, contrastantes em relação à ferrugem do cafeeiro. Os métodos bayesianos apresentaram melhor desempenho para a produção, já o QRF foi igual ou superior aos outros métodos para as características bicho mineiro e cercosporiose, com tempo de processamento muito inferior comparado ao Bayes C𝜋 e Bayes D𝜋. O QRF surge, então, como um algoritmo promissor para predição possibilitando, em alguns cenários, predições mais acuradas de GWS. Palavras-chave: Predição Genômica. Simulação de Dados. Melhoramento Genético do Cafeeiro. Métodos Bayesianos. G-BLUP. Aprendizado de Máquinas.Item Regressão quantílica aplicada à seleção genômica para características oligogênicas em melhoramento de plantas autógamas(Universidade Federal de Viçosa, 2019-02-21) Oliveira, Gabriela França; Nascimento, Ana Carolina Campana; http://lattes.cnpq.br/9895689990102944O constante crescimento populacional e as limitadas áreas agricultáveis requerem o aumento da produtividade das espécies agronômicas. Nos últimos 50 anos estima-se que 50% do aumento da produtividade mundial dessas espécies foi devido ao melhoramento genético. Para que o melhoramento seja feito de forma eficiente, o conhecimento do sistema reprodutivo das espécies a serem melhoradas é de suma importância para um melhorista, uma vez que tal conhecimento auxilia na adoção de métodos adequados para cada espécie. Em geral, a obtenção de cultivares melhoradas é um processo longo e oneroso. Visando a redução de tempo e custos, além do aumento da acurácia de seleção, a Seleção Genômica Ampla (Genome Wide Selection - GWS) que utiliza informações diretas do DNA por meio dos marcadores moleculares para predição do valor genético genômico dos indivíduos, foi proposta. Dentre as diversas metodologias de GWS, recentemente, foi proposto o uso da Regressão Quantílica Regularizada (RQR). A RQR permite ajustar modelos de regressão ao longo de toda distribuição da variável dependente, possibilitando assim uma melhor descrição do fenômeno em estudo, quando comparada a metodologias tradicionais que se baseiam apenas na média condicional. O uso da RQR tem-se mostrado bastante promissor, porém, ainda não foi avaliado em todo o processo de um programa de melhoramento de plantas. Diante do exposto, objetivou-se avaliar o uso da RQR na seleção genômica, considerando dados simulados de plantas autógamas com características oligogênicas. Foi simulada uma população F 2 , com características com duas herdabilidades (0,4 e 0,8) e controladas por quatro genes. Foi realizado o avanço de gerações (até a F 6 ) considerando duas porcentagens de seleção (10% e 20%) e, como critério de seleção, o valor genético genômico obtido por meio da RQR, além da seleção fenotípica e de outros métodos tradicionais de seleção genômica, especificamente RR-BLUP e o BLASSO. Observou- se que o modelo de RQR apresentou, em relação a fixação dos alelos favoráveis, resultados melhores ou iguais aqueles obtidos por todos métodos avaliados. Especificamente, em cenários de herdabilidade 0,4, independente da porcentagem de seleção, somente a seleção dos indivíduos baseados no modelo de RQR no quantil (τ = 0,5) foi capaz de fixar os alelos favoráveis até a sexta geração. Por outro lado, em cenários de maior herdabilidade (0,8) e com porcentagem de seleção de 10%, a seleção baseada nos métodos RQR (τ = 0,5) e BLASSO permitiram a fixação dos alelos ainda na geração F 4 . Quando a seleção se baseou nos métodos RR-BLUP e seleção fenotípica os alelos favoráveis não foram fixados até a sexta geração em nenhum cenário avaliado. Em relação ao ganho de seleção, a RQR (τ = 0,5) obteve ganhos maiores ou iguais aos métodos tradicionais de seleção genômica em todos os cenários avaliados. Especificamente, os ganhos da RQR (τ = 0,5) foram até 4,5% maiores que aqueles obtidos pelo BLASSO, até 6,1% maiores que os do RR-BLUP e até 4,6% maiores que a seleção fenotípica. Dessa forma verificou-se com aplicação da RQR no melhoramento de plantas considerando populações simuladas de plantas autógamas com características oligogênicas, seria possível uma redução de tempo e consequentemente de custos, devido a diminuição das gerações de autofecundações para a fixação dos alelos favoráveis em todos os cenários avaliados ou a obtenção de genótipos melhorados.
