Estatística Aplicada e Biometria

URI permanente para esta coleçãohttps://locus.ufv.br/handle/123456789/195

Navegar

Resultados da Pesquisa

Agora exibindo 1 - 2 de 2
  • Imagem de Miniatura
    Item
    Stacking Ensemble Learning para seleção genômica em características complexas
    (Universidade Federal de Viçosa, 2025-07-09) Celeri, Maurício de Oliveira; Nascimento, Moysés; http://lattes.cnpq.br/2569243563413784
    A seleção genômica (SG), proposta pela primeira vez por Mewissen et al. em 2001, tem por objetivo estimar os valores genéticos genômicos como uma soma dos efeitos de todos os marcadores distribuídos ao longo do genoma. A possibilidade de reduzir o tempo necessário para desenvolvimento de novas variedades torna a SG um componente primordial em programas de melhoramento. No entanto um ponto crucial na SG é decidir qual método estatísticas será utilizado para estimação dos efeitos de marcadores e, posteriormente, predizer os valores genéticos genômicos de indivíduos não fenotipados. Diversas metodologias foram propostas, como, por exemplo, o GBLUP, as Redes Neurais Artificiais e o alfabeto bayesiano. Em especial para características genéticas quantitativas, alguns métodos podem apresentar limitações devido à complexidade. Recentemente uma classe de modelos de aprendizagem em conjunto vem ganhando destaque nos estudos de seleção e predição genômica: a aprendizagem ensemble, em especial o stacking. Stacking é uma forma usual de método ensemble onde a predição de cada um dos modelos usados na aprendizagem de base é usada como variáveis de entrada para treinar um novo modelo de regressão para a predição final, podendo apresentar maior poder de generalização e representações não lineares. O objetivo deste trabalho é avaliar diferentes configurações para os métodos stacking em predição genômica de características complexas. Para isso, será utilizado um conjunto de dados simulados com 10 características fenotípicas distintas, cada qual com uma arquitetura genética própria. A validação cruzada foi 5-fold e foram testadas diferentes formas de se selecionar os aprendizes de base provindas de modelos como GBLUP, splines de regressão adaptativa multivariada, Bayes A, Bayes A com inclusão de efeitos de dominância, Bayes B, árvore de regressão, bagging, boosting e random forest. Diferentes formas de predição final, escolhidas entre mínimos quadrados ordinários e dos métodos para solução da multicolinearidade: regressão ridge, LASSO, regressão de componentes principais, regressão de fatores e redes neurais artificiais. Os resultados mostram um ganho de até 82,76% na capacidade preditiva quando utilizado as predições de aprendizes de base que apresentaram capacidade preditiva acima da média de capacidades preditivas de treinamento e quando feita a seleção pelo quantil 75% da distribuição das capacidades preditivas. Dentre todos os meta-aprendizes utilizados foi observado que os métodos baseados em redução de dimensionalidade e penalização apresentaram melhores resultados de predição. Palavras-chave: seleção genômica; stacking ensemble learning; efeitos não aditivos
  • Imagem de Miniatura
    Item
    Splines de regressão adaptativa multivariada na predição genômica
    (Universidade Federal de Viçosa, 2020-10-27) Celeri, Maurício de Oliveira; Nascimento, Moysés; http://lattes.cnpq.br/2569243563413784
    A Seleção Genômica Ampla (SGA), proposta em 2001, é uma variação da Seleção Assistida por Marcadores (SAM) que prediz o valor genético genômico com base em marcadores distribuídos ao longo de todo o genoma. Desde sua proposição vários métodos estatísticos vêm sendo propostos para SGA, dentre os quais podemos destacar o Melhor Preditor Linear não Viesado Genômico (G-BLUP), uma das abordagens mais amplamente difundida devido a sua simplicidade e por permitir considerar efeitos não aditivos em seu ajuste. Uma metodologia ainda não explorada em SGA é a Splines de Regressão Adaptativa Multivariada (MARS). A MARS modela efeitos individuais e possíveis interações entre variáveis preditoras, podendo ser particularmente útil para SGA considerando efeitos não aditivos. Diante disso o objetivo deste trabalho é avaliar a utilização da MARS em SGA, considerando características quantitativas com efeitos não aditivos. Para isso, fez-se uso de um conjunto de dados simulados de 1000 indivíduos com 4010 marcadores SNPs e 12 cenários considerando efeitos não aditivos, definidos pela combinação de oito, 40, 80 ou 120 locus controladores e herdabilidade 0,3, 0,5 ou 0,8. Confrontou-se os resultados da MARS contra os resultados obtidos com o modelo ajustado G-BLUP considerando efeitos aditivos, aditivos e devido a dominância e aditivos e devido a epistasia aditiva-aditiva no que se refere à capacidade preditiva e ao coeficiente kappa de Cohen para seleção de indivíduos superiores. MARS apresentou resultados de capacidade preditiva superior a todos os modelos G-BLUP ajustado para os cenários de herdabilidade 0,3 e resultados semelhantes nos demais casos. Quanto ao coeficiente kappa de Cohen, MARS foi superior aos métodos G-BLUP em 11 dos 12 cenários avaliados. Portanto, MARS é uma metodologia que apresenta potencial para estudos em SGA. Palavras-chave: Regressão. Aprendizado estatístico. Seleção genômica ampla. Efeitos não aditivos.