Estatística Aplicada e Biometria

URI permanente para esta coleçãohttps://locus.ufv.br/handle/123456789/195

Navegar

Resultados da Pesquisa

Agora exibindo 1 - 4 de 4
  • Imagem de Miniatura
    Item
    Síndrome da fadiga crônica e absenteísmo: estudo de trabalhadores em turnos comparando stepwise e elastic-net
    (Universidade Federal de Viçosa, 2020-02-28) Neisse, Anderson Cristiano; Oliveira, Fernando Luiz Pereira de; http://lattes.cnpq.br/5364139874668396
    Caracterizada por fadiga persistente, dor muscular, dificuldades cognitivas e de sono, a Sídrome da Fadiga Crônica (CFS) tem se tornado comum nas práticas clínicas nas últimas décadas desde sua recente definição, em 1988. Estudos resultantes da contínua busca por fatores relacionados à CFS citam, dentre outros: sono irregular/insatisfatório, estresse psicológico, disfunção hormonal, deficiência de nutrientes, disfunção imunológica e infecções. Em condições de trabalho de risco o desenvolvimento da CFS pode aumentar a chance de acidentes fatais, tal como o trabalho em turnos na área de mineração que naturalmente já possui fatores evidentemente relacionados à CFS. Estudos indicam que indivíduos com má qualidade de sono e ciclos circadianos irregulares têm risco elevado de CFS, neuroticismo e absenteísmo. Uma vez que modelagem preditiva pode se mostrar efetiva tanto na pre- venção da fadiga quanto na detecção de fatores, este estudo tem o objetivo de utilizar de regressão logística ajustada por meio de dois métodos de seleção/regularização (Stepwise e Elastic-Net) para procurar modelo que descreva a relação entre variáveis bioquímicas e antropométricas com o absenteísmo. Desta forma, por meio do absenteísmo e utilizando de efeitos encontrados na bibliografia, o objetivo é procurar evidência de relação entre a CFS e absenteísmo. Os resultados obtidos mostram indícios de relação do colesterol total, HDL, LDL e Triglicerídeos com o risco de absenteísmo, relação também presente para as variáveis de sódio e potássio. Com exceção ao potássio, todas as variáveis também possuem relação similar com a CFS, de acordo com a literatura. PALAVRAS-CHAVE: Síndrome da Fadiga Crônica. Biometria. Regressão Logística. Elastic-Net.
  • Imagem de Miniatura
    Item
    Golias: software para análises estatística e biométrica de grande conjunto de dados utilizando as linguagens Júlia e R
    (Universidade Federal de Viçosa, 2018-02-21) Oliveira, Cristiano Ferreira de; Cruz, Cosme Damião; http://lattes.cnpq.br/0880202677543608
    A utilização de informações de marcadores moleculares para identificação de indivíduos geneticamente superiores para características de interesse é uma as principais contribuições da genética molecular no melhoramento genético. Assim, em programas de melhoramento genético, é crescente o uso de marcadores moleculares dispostos em matrizes de alta densidade, que necessitam de controle de qualidade e uso de metodologias adequadas para realizar a predição dos valores genéticos. Diante do exposto este trabalho tem como objetivo apresentar o software Golias, que é um software livre destinado ao processamento de dados de marcadores SNPs de alta dimensão. O Golias é integrado com os ambientes de programação R e Julia, utilizando o poder de processamento da linguagem Júlia e de pacotes do R otimizados em código C. Todas as análises são realizadas sem fazer necessário que o usuário tenha qualquer conhecimento em programação. O software proposto dispõe de procedimentos para o controle de qualidade de SNPs como call rate, MAF, teste de equilíbrio de Hardy-Weinberg, descarte de variáveis via componentes principais, um procedimento para imputação de informações genotípicas perdidas e algumas técnicas de predição utilizando métodos bayesianos. O Golias está disponível em português; pode ser baixado da Internet (https://www.dropbox.com/sh/ql92mzjed8735wq/AADfVadXY3oYM_3qe84Vb N-Ea?dl=0) e é compatível com sistema operacional Windows.
  • Imagem de Miniatura
    Item
    Regressão quantílica: aplicações em seleção genômica ampla
    (Universidade Federal de Viçosa, 2018-02-02) Barroso, Laís Mayara Azevedo; Nascimento, Moysés; http://lattes.cnpq.br/8587813175766141
    A principal contribuição da genética molecular no melhoramento é a utilização direta das informações de DNA no processo de identificação de indivíduos geneticamente superiores. Sob esse enfoque, idealizou-se a seleção genômica ampla (Genome Wide Selection – GWS), a qual consiste no uso de um grande número de marcadores SNPs (Single Nucleotide Polymorphisms) amplamente distribuídos no genoma para predizer o mérito genético de indivíduos. Diversas abordagens estatísticas foram propostas para a predição de valores genéticos permitindo estimar os efeitos dos marcadores com base apenas na média condicional da variável dependente. Uma metodologia ainda pouco explorada em GWS é a regressão quantilica (RQ). Diferentemente das outras metodologias, a RQ permite avaliar os fenótipos de interesse em diferentes níveis da distribuição. Desta forma, este trabalho tem como objetivo apresentar duas aplicações de GWS utilizando a RQ. Na primeira aplicação foi proposto e avaliado o uso da Regressão Quantílica Regularizada (RQR) para estimar os efeitos marcadores SNPs para curvas de crescimento em suínos. O modelo proposto permitiu a descoberta, em diferentes níveis de interesse (quantils), de marcadores relevantes para cada característica e suas respectivas posições cromossômicas. Além disso, RQR permitiu a construção de curvas de crescimento genômico, que identificaram indivíduos geneticamente superiores em relação à eficiência de crescimento. Na segunda aplicação utilizou-se a RQR para predizer valores genéticos de conjuntos de dados simulados com diferentes proporções de epistasia na variância genética e valores fenótipos com distribuições simétrica e assimétrica a direita. Neste trabalho verificou-se que a RQR teve, em geral, maiores acurácias do que as outras metodologias avaliadas quando a característica é de baixa herdabilidade. Além disso, quando tem-se 100% da variância genética como sendo epistática, a RQR foi, na maioria dos casos, melhor do que os métodos tradicionais. Desta forma, avaliando as duas aplicações apresentadas, tem-se que a RQR é uma alternativa interessante em estudos de GWS, uma vez que possibilita a descoberta do modelo que melhor representa a relação entre as variáveis dependentes (fenótipos) e independentes (efeitos dos marcadores) aumentando o desempenho preditivo do modelo.
  • Imagem de Miniatura
    Item
    Predição de valores genéticos por abordagens de seleção genômica ampla e de inteligência computacional
    (Universidade Federal de Viçosa, 2018-02-01) Silva, Gabi Nunes; Cruz, Cosme Damião; http://lattes.cnpq.br/6670284847005434
    Os programas de melhoramento genético existem com dois objetivos principais: identificação de genótipos superiores e a obtenção de combinações melhoradas por meio de cruzamento entre esses indivíduos elite. Os mais diversos ramos da genética, estatística e biometria contribuíram para o estabelecimento de diferentes estratégias de melhoramento para seleção de genótipos superiores. Em particular, metodologias baseadas em seleção genômica ampla tem apresentado grande destaque dentre os estudos mais recentes de seleção. A seleção genômica ampla (Genome Wide Selection), envolve estudos biométricos e une genética de populações, genética molecular e a genética quantitativa. A maior motivação para tais estudos consiste na possibilidade de utilizar genotipagem em grande escala e incorporar informações genômicas no processo de predição, de modo a aumentar a eficiência seletiva, obter ganhos genéticos de forma mais ágil e diminuir os custos. Nos modelos de genética, as variações fenotípicas dos indivíduos consistem na variância genotípica dos mesmos agregando variâncias devido a dominância, variância ambiental e também epistasia. No entanto, os modelos de GWS, de modo geral, negligenciam a influência de dominância e epistasia, levando em consideração apenas os efeitos aditivos das características. Além disso, a alta densidade de marcadores moleculares pode levar a problemas de dimensionalidade e multicolinearidade. Neste contexto, o uso de estratégias de redução de dimensionalidade e de metodologias baseadas em inteligência computacional que abordem mais adequadamente a inclusão de tais efeitos em estudos de seleção e predição constituem a proposta neste trabalho. O trabalho visa abordar três tópicos principais: o capitulo propõe avaliar a eficiência do RR-BLUP para predição de valores genéticos de uma população simulada com 12 características complexas que contemplavam efeitos de dominância, epistasia e efeitos ambientais. No capítulo 2 propõe-se a aplicação dos Métodos de Regressão Stepwise e da Sonda para redução de dimensionalidade a fim de aumentar a eficiência preditiva do método RR-BLUP aplicado na mesma população considerada no capitulo 1. Finalmente, o capítulo 3 visa avaliar a eficiência das metodologias de inteligência computacional baseadas em Redes Neurais Artificiais de Redes Perceptron Multicamadas e as Redes de Função de Base Radial para predição dos valores genéticos da população simulada abordada nos capítulos anteriores. Os resultados indicaram que o uso de metodologias de redução de dimensionalidade contribui para o aumento da eficiência do método RR-BLUP. No entanto, também evidenciaram a deficiência desse método para predizer valores genéticos de populações que incluam efeitos de dominância e epistasia no controle gênico das características de interesse. As metodologias de Redes Neurais Multicamadas e as Redes de função de Base Radial propostas apresentaram acurácia preditiva, expressa pelo erro quadrático médio, superior à apresentada pelo RR-BLUP, demonstrando que as metodologias de inteligência computacional foram mais eficientes que a Seleção Genômica Ampla para o estudo de características complexas com controle gênico envolvendo efeitos aditivos, dominantes e epistáticos.