Estatística Aplicada e Biometria
URI permanente para esta coleçãohttps://locus.ufv.br/handle/123456789/195
Navegar
5 resultados
Resultados da Pesquisa
Item Redes neurais regularizadas na predição de características agronômicas de soja(Universidade Federal de Viçosa, 2024-04-03) Costa, Noé Mitterhofer Eiterer Ponce de Leon da; Nascimento, Moysés; http://lattes.cnpq.br/9184271760739064Um dos métodos de aprendizado de máquina utilizado atualmente na Seleção Genômica (SG) são as Redes Neurais Artificiais (RNAs) e, dentre estas, a Rede Perceptron de Múltiplas Camadas (PMC). O PMC destaca-se na solução de problemas de classificação ou regressão pelo fato de não exigir um modelo funcional, nem de atender pressuposições e não requerer conhecimento a priori sobre o fenômeno em estudo. No entanto, um problema comum nas PMC é o overfitting, que se trata de um superajustamento da rede aos dados de treinamento. Nestes casos, o modelo não possui capacidade de generalização fazendo que ele seja menos eficaz nas predições em um novo conjunto de dados ou no conjunto de teste. Para contornar este problema, algumas alternativas são as regularizações L1 e L2, que se baseiam nas regressões em penalizações similares aos métodos Lasso e Ridge, respectivamente. O objetivo deste estudo foi avaliar a eficiência do uso da regularização em modelos de PMC aplicados na predição genômica. Além disso, os resultados obtidos foram comparados com outros utilizados em predição genômica, tais como o Perceptron de Múltiplas Camadas (PMC), Árvore de Decisão (AD), Random Forest (RF), Bagging (BAG), Boosting (BOO) e Genomic Best Linear Unbiased Prediction (GBLUP). Os dados são provenientes de 100 genótipos de soja, em um experimento conduzido de setembro a novembro de 2021, no delineamento em blocos ao acaso com três repetições, em que cada parcela foi constituída de uma planta cultivada em um vaso dentro de uma casa de vegetação. Foram avaliadas as características diâmetro de hipocótilo (DH, em milímetros), altura de planta (AP, em centímetros), comprimento total de raiz (CR, em centímetros) e área superficial projetada de raiz (AR, em centímetros quadrados). Na avaliação do PMC regularizado (PMCR), foram utilizados as medidas de capacidade preditiva (CP) e raiz do erro quadrático médio (RMSE) para comparação dos métodos. Em geral, o PMC com regularização L2 melhorou o desempenho em comparação com métodos avaliados em termos de CP e RMSE. Os valores de CP obtidos pelas redes regularizadas L2 foram melhores que todos os métodos avaliados. Especificamente, quando comparado com o segundo o melhor método, os ganhos em termos de CP foram de 6,05%, 25,86%, 32,90% e 0,16% para as características, respectivamente, AP, DH, CR e AR. Já em termos de RMSE, o PMCR apresentou resultados inferiores e desejáveis em 10,81%, 15,00%, 13,62% e 20,41% para as características AP, DH, CR e AR, respectivamente, quando comparado com as redes sem regularização. Quando a comparação é entre todas as metodologias comparativas, o GBLUP obteve o menor valor de RMSE para todas características avaliadas. Palavras-chave: Capacidade Preditiva. Machine Learning. Predição Genômica.Item Seleção de marcadores utilizando probabilidade a posteriori de inclusão no modelo para predição genômica(Universidade Federal de Viçosa, 2023-07-18) Begnami, Vinicius Silva; Azevedo, Camila Ferreira; http://lattes.cnpq.br/3707637931879411Com o aumento constante da população mundial, a demanda por alimentos está crescendo diariamente, embora as áreas agricultáveis estejam chegando ao seu limite territorial. Uma solução para enfrentar esse desafio é a aplicação do melhoramento genético, que ganha cada vez mais destaque devido à sua capacidade de aumentar a produtividade e melhorar a qualidade dos alimentos em uma área de cultivo limitada. Com os avanços na genética molecular, é possível obter informações genéticas diretamente do DNA por meio de marcadores moleculares, especialmente os SNP (Single Nucleotide Polimorphism), que têm sido utilizados em estudos de Seleção Genômica Ampla (GWS, Genome Wide Selection). A GWS busca estimar os valores genéticos genômicos (GEBV, Genomic Estimated Breeding Value) dos indivíduos com base em informações genotípicas. No entanto, ao ajustar o modelo de predição, a alta dimensionalidade e multicolinearidade representam desafios, uma vez que o número de marcadores é muito superior ao número de indivíduos avaliados. Como nem todos os marcadores do genoma influenciam uma característica fenotípica específica, é comum realizar uma seleção prévia desses marcadores. Neste contexto, este estudo propõe a seleção os marcadores mais relevantes para a predição genômica com base em sua probabilidade de inclusão. Para atingir esse objetivo, a dissertação foi dividida em dois capítulos. O Capítulo 1 consiste em uma revisão de literatura sobre as metodologias estatísticas que serão aplicadas no próximo capítulo. O Capítulo 2 tem como principal objetivo a seleção dos marcadores mais relevantes a partir de um conjunto de dados reais originários do arroz Oryza Sativa. Este conjunto de dados contém 413 acessos genotipados para 44.100 marcadores do tipo SNP. A seleção dos marcadores é realizada com base na probabilidade a posteriori de inclusão, com cálculos apoiados na matriz de efeitos dos marcadores moleculares, estimados por meio do método BayesDπ, e no número total de iterações salvas. Após a seleção dos marcadores mais relevantes, eles são agrupados em conjuntos de 2.000, 4.000, 6.000, ..., até 36.901, de acordo com sua importância. Em seguida, cada grupo tem seu efeito estimado pelo método BayesA, e a capacidade preditiva do modelo de predição é calculada. Essa métrica é comparada com a capacidade preditiva dos modelos de predição ajustados pelos métodos bayesianos BayesA e BayesD𝜋, quando aplicados separadamente e sem a prévia seleção dos marcadores. Os resultados obtidos indicam que a seleção de marcadores mais relevantes para a predição genômica se mostra eficaz, com alta capacidade preditiva em comparação aos métodos BayesA e BayesD𝜋 quando usados isoladamente e sem a prévia seleção. Além disso, a probabilidade a posteriori de inclusão também demonstrou ser eficaz na compreensão da arquitetura genética da característica em estudo. Assim, a seleção de marcadores contribui para a redução da alta dimensionalidade, o aumento da capacidade preditiva do modelo de predição genômica e a redução do esforço computacional, abordando problemas recorrentes na seleção genômica. Palavras-chave: Marcadores Moleculares. Arroz. Seleção Genômica. Genética. Melhoramento Genético.Item Painéis de marcadores de baixa densidade para a predição genômica de Coffea arábica L.(Universidade Federal de Viçosa, 2021-07-22) Arcanjo, Edilaine Silva; Nascimento, Ana Carolina Campana; http://lattes.cnpq.br/2563424950732312Os processos de melhoramento genético são primordiais para o desenvolvimento de novas cultivares. Em decorrência da importância da cafeicultura brasileira, esse setor tem sofrido transformações através das pesquisas em programas de melhoramento. Os progressos do Coffea arábica atingidos pelo melhoramento genético têm propiciado a aquisição e recomendação de inúmeras cultivares que possuem características que a elas foram adicionadas por essa técnica. Entretanto, um dos maiores impasses do melhoramento genético vegetal é que para a obtenção de uma nova cultivar, o processo é muitas vezes lento e demorado. Dessa forma, o uso da biotecnologia, com a utilização dos marcadores moleculares, apresentou-se como uma alternativa para amenizar esse problema. Neste contexto, foi proposto a seleção genômica ampla (Genome Wide Selection-GWS), que parte do pressuposto que todos os segmentos do genoma colaboram para a variação genética e cada segmento está em alto desequilíbrio de ligação (LD) com no mínimo um marcador genético conhecido. A GWS fundamenta-se nos marcadores moleculares do tipo SNP (Single Nucleotide Polymorphism), que são abundantemente distribuídos ao longo do DNA. Com o advento dos SNPs, os valores genéticos genômicos estimados (GEBVs) puderam ser calculados através dos efeitos desses marcadores. Desse modo, os SNPs têm proporcionado a melhor cobertura do genoma; no entanto, normalmente a execução da seleção genômica requer uma grande genotipagem populacional para os indivíduos de treinamento e os candidatos à seleção, o que pode ocasionar em um aumento do custo total do programa de melhoramento. Assim, este trabalho teve por objetivo avaliar a viabilidade do uso de painéis de marcadores de baixa densidade na predição do GEBV de características economicamente importantes de C. arábica, com a finalidade de reduzir os custos de genotipagem a partir da utilização de chips customizados. Os resultados obtidos neste estudo demonstraram que o uso desses painéis na GWS pode ser uma ferramenta útil para o melhoramento dessa espécie, uma vez que modelos baseados nestes painéis apresentaram boas estimativas de capacidades preditivas e substanciais valores de concordância em termos de seleção quando comparados à modelos de maior densidade de marcadores. Palavras-chave: Melhoramento Genético. Café. Seleção Genômica. G-BLUP.Item Análise de fatores aplicada em estudos de seleção genômica no melhoramento de Coffea canephora(Universidade Federal de Viçosa, 2020-02-20) Paixão, Pedro Thiago Medeiros; Nascimento, Ana Carolina Campana; http://lattes.cnpq.br/0114089076153492O Brasil se destaca em âmbito mundial na produção de café. Os incrementos observados em sua produtividade é resultado do aprimoramento de diversas metodologias. Dentre elas, destacam-se os métodos preditivos de valor genético. Estes contribuem significativamente na seleção de genótipos superiores, de forma a aumentar o ganho genético por unidade de tempo. Neste contexto, a seleção genômica ampla (GWS) é uma ferramenta que se destaca, uma vez que permite predizer o fenótipo futuro de um indivíduo baseado apenas em informações de marcadores moleculares. Realizar a seleção de maneira simultânea para várias características é o interesse da maioria dos programas de melhoramento, e a análise de fatores (AF) tem sido utilizada para auxiliar neste fim. A utilização de fatores se justifica devido a existência de correlações genéticas entre as características, as quais podem ser atribuídas aos QTL que têm efeitos pleiotrópicos ou aos QTL estreitamente ligados. Dessa forma, o objetivo deste trabalho foi de avaliar o uso da AF no contexto de GWS, em genótipos de Coffea canephora. Os resultados obtidos da seleção baseada nos fatores foram comparados, por meio da capacidade preditiva, acurácia e do coeficiente de Cohen’s Kappa, com aqueles advindos da análise das variáveis individuais. Para isso, foram utilizados dados fenotípicos e genotípicos de populações compostas por clones dos grupos varietais Conilon e Robusta e por híbridos originados de cruzamentos entre estes grupos, avaliados durante três anos consecutivos (2014 a 2016), e uma densidade de 18111 marcadores SNPs identificados. A partir dos resultados observados, verificou-se que a AF foi eficiente para elucidar as relações entre as características e originar novas variáveis. Os fatores formados são interessantes em termos de seleção, pois além de permitirem interpretações conjuntas, apresentam boas estimativas de capacidade preditiva, herdabilidade e acurácia. Ademais observou-se alta concordância entre os indivíduos selecionados com base nos fatores e aqueles selecionados considerando as variáveis individuais. Entretanto, cabe destacar que, a seleção baseada nos fatores conseguiu selecionar indivíduos de porte mais adequado. Palavras-chave: Predição Genômica. Análise Multivariada. Melhoramento Genético.Item Análise de fatores aplicada a predição genômica considerando seleção de marcadores em Oryza sativa(Universidade Federal de Viçosa, 2021-02-19) Fialho, Izabela Clara; Azevedo, Camila Ferreira; http://lattes.cnpq.br/1414652656084772O arroz asiático Oryza sativa é um dos alimentos mais consumidos em grande parte do mundo. Assim, o crescimento populacional justifica o interesse dos pesquisadores em tornar as variedades deste arroz altamente produtivas. Para alcançar esse objetivo, a Seleção Genômica Ampla (Genome Wide Selection - GWS) é uma ferramenta utilizada pelos programas de melhoramento. A GWS emprega dados fenotípicos e genotípicos por meio de marcadores SNPs (Single Nucleotide Polymorphism) amplamente distribuídos no genoma. Porém, nem todos estes SNPs estão associados as características de relevância para o pesquisador, o que torna necessário o uso de métodos estatísticos para a seleção de marcadores. O BLUP genômico (Genomic best linear unbiased prediction – G-BLUP) é um método amplamente aplicado a predição genômica, e quando este está associado a seleção de marcadores dá origem ao chamado G-BLUP supervisionado. Dessa forma, o presente trabalho objetivou-se avaliar a eficiência na predição genômica ao combinar a análise de fatores e a seleção de marcadores via G-BLUP supervisionado para grupos de características de interesse. O conjunto de dados de arroz utilizado é público e faz parte de dois projetos, o Projeto OryzaSNP e o Projeto OMAP e está disponível no site http://ricediversity.org/data/. O arquivo contém informações de 28 características fenotípicas e 36.901 marcadores SNPs de 413 indivíduos. Os resultados obtidos indicam que a aplicação da análise de fatores combinada à seleção de marcadores SNPs para a predição genômica se mostrou eficiente, visto que apresentaram valores semelhantes para capacidade preditiva em relação aos encontrados considerando as análises individuais das variáveis (em ambas as análises obteve-se variação entre 0,6 a 0,8 de capacidade preditiva) e alta concordância (acima de 50% de concordância para todos os grupos de marcadores) entre os indivíduos selecionados considerando o fator e as variáveis individuais. Palavras-chave: Arroz. Seleção genômica. G-BLUP.