Estatística Aplicada e Biometria
URI permanente para esta coleçãohttps://locus.ufv.br/handle/123456789/195
Navegar
5 resultados
Resultados da Pesquisa
Item Identificação de outliers multivariados - Uma aplicação em dados de saúde(Universidade Federal de Viçosa, 2017-02-17) Barbosa, Josino José; Oliveira, Fernando Luiz Pereira de; http://lattes.cnpq.br/1948800098593563A identificação de outliers desempenha um papel importante na análise estatística, pois tais observações podem conter informações importantes em relação aos dados. Se modelos estatísticos clássicos são cegamente aplicados a dados contendo valores atípicos, os resultados podem ser enganosos e decisões equivocadas podem ser tornadas. Além disso, em situações práticas, os próprios outliers são muitas vezes os pontos especiais de interesse e sua identificação pode ser o principal objetivo da investigação. Por isso, a finalidade desse trabalho é propor uma técnica de detecção de outliers multivariados, baseada em análise agrupamento e comparar essa técnica com o método de identificação de outliers via Distância de Mahalanobis. Para geração dos dados utilizou-se simulação através do Método de Monte Carlo e a técnica de mistura de distribuições normais multivariadas. Os resultados apresentados nas simulações mostram que o método proposto foi superior ao método de Mahalanobis tanto para sensibilidade quanto para especificidade, ou seja, ele apresenta maior capacidade de diagnosticar corretamente os indivíduos outliers e os não outliers. Além disso, a metodologia proposta foi ilustrada com uma aplicação em dados reais provenientes da área de saúde.Item Seleção de variáveis no estudo da diversidade genética via análise de procrustes(Universidade Federal de Viçosa, 2016-02-24) Pontes, Daiana Salles; Cruz, Cosme Damião; http://lattes.cnpq.br/6638973949782292Para o sucesso de um programa de melhoramento é indispensável que população de trabalho disponha de variabilidade genética de forma que a prática de seleção seja viável. Nesse sentido, a avaliação da divergência genética têm sido de grande importância por fornecerem parâmetros para a identificação de combinações híbridas cujo cruzamento proporcione maior efeito heterótico e maior probabilidade de recuperar genótipos superiores nas gerações segregantes. O estudo sobre diversidade genética elucida relações genéticas, quantifica ou prediz o nível de variabilidade total existente e sua distribuição entre indivíduos, acessos de bancos de germoplasma, linhagens e cultivares ou dentro de populações e espécies. Conhecimento que tem proporcionado, dentre outras coisas, importantes contribuições ao melhoramento genético, ao gerenciamento de bancos de germoplasma e à conservação de recursos genéticos. Assim, o interesse maior, em estudos de caracterização da diversidade genética das espécies vegetais, animais e de microrganismos consiste na identificação de grupos de genótipos similares de forma que a maior diferença entre os grupos formados seja realçada. Para isso, algumas técnicas multivariadas, como análise discriminante, componentes principais, análise de coordenadas e de agrupamento podem ser utilizadas nesse tipo de estudo. Contudo, de modo geral, tais técnicas ainda exigem a utilização de todas as variáveis para a avaliação dos indivíduos/acessos, o que nem sempre é possível devido ao alto custo ou mesmo o grau de dificuldade envolvido na obtenção de determinadas variáveis. É necessária, portanto, a aplicação de algum método de seleção de variáveis ou de um critério de seleção baseado em alguma técnica analítica, como é o caso do critério apresentado por Jolliffe (1972). Baseado na técnica de componentes principais, esse critério é usualmente utilizado na determinação da importância relativa de caracteres no estudo da diversidade de modo que caracteres de menor importância serão desconsiderados do estudo. Há também outra metodologia baseada em Análise de Procrustes ainda pouco utilizada em estudos de diversidade genética, sobretudo para este fim, por meio da qual é possível selecionar variáveis com base no padrão de dissimilaridade ou similaridade entre acessos. Desta forma, este trabalho tem por objetivo propor um critério baseado em Análise de Procrustes como nova possibilidade para a seleção de variáveis no estudo da diversidade genética. Em seguida, comparar o critério apresentado com o critério proposto por Jolliffe (1972) - ambos os critérios estabelecidos por meio do uso de componentes principais. Para elucidar a teoria apresentada, foram consideradas informações de 40 acessos de café Conilon avaliados em Sooretama/ES no ano 2000 segundo 16 caracteres agronômicos. As técnicas apresentadas neste trabalho demonstram ser vantajosas na seleção (ou descarte) de variáveis proporcionando relevante contribuição para os estudos sobre diversidade genética. A técnica apresentada, baseada em análise de Procrustes, torna-se uma alternativa mais eficaz do que o uso do critério de Jolliffe (1972) para fins de estudo da diversidade genética.Item Análise biométrica de acessos de Capsicum chinense Jacq. com ênfase na diversidade genética(Universidade Federal de Viçosa, 2016-02-23) Oliveira, Ana Carolina Ribeiro de; Cecon, Paulo Roberto; http://lattes.cnpq.br/0231423029429573Os estudos de divergência genética são fundamentais para subsidiar ações de conservação, de utilização dos recursos genéticos e posterior aplicação em programas de melhoramento, visando à obtenção de genótipos superiores. Sendo assim, este trabalho teve por objetivo avaliar a diversidade genética de acessos de pimenta, Capsicum chinense Jacq., por meio de técnicas multivariadas de agrupamentos utilizando os métodos hierárquicos (UPGMA e Ward) e de otimização (Tocher e Tocher modificado). O experimento foi conduzido na área experimental do setor de olericultura do Departamento de Fitotecnia da Universidade Federal de Viçosa (UFV), sob delineamento inteiramente casualizado, com quatro repetições e uma planta por parcela. Foram avaliados 11 acessos de C. chinense registrados no Banco de Germoplasma de Hortaliças (BGH/UFV), com base em 11 caracteres. Os resultados indicaram pelos métodos hierárquicos a formação de dois grupos, sendo que 72,73% dos acessos pertenciam ao grupo I e 27,27% ao grupo II; e ambas as estruturas de agrupamento foram validadas pelo coeficiente de correlação cofenética (r). Os métodos de otimização, Tocher e Tocher modificado, reuniram os acessos em seis e quatro grupos, respectivamente, revelando maior diversidade dos acessos em relação aos métodos anteriores. Assim, independente do método utilizado foi possível identificar os acessos mais divergentes e, consequentemente, contribuir para futuras pesquisas de cruzamento buscando híbridos com maior efeito heterótico.Item Predição fenotípica em cana-de-açúcar via modelos multivariados com dados de espectroscopia no infravermelho próximo(Universidade Federal de Viçosa, 2016-02-24) Fernandes, Jaqueline Gonçalves; Peternelli, Luiz Alexandre; http://lattes.cnpq.br/3794489635901020A produção da cana-de-açúcar desempenha papel fundamental na economia do país. Para o desenvolvimento de variedades que atendam as necessidades atuais e também as necessidades futuras é essencial buscar métodos de fenotipagem que proporcionem maior facilidade de utilização, além de rapidez, exatidão e consistência. Visando contribuir para o desenvolvimento de novas estratégias de fenotipagem, esse trabalho teve como objetivo principal construir modelos de predição fenotípica utilizando calibração multivariada. Foram construídos modelos empregando regressão por quadrados mínimos parciais (PLS), regressão por componentes principais (PCR), Ridge Regression (RR- BLUP) e Lasso bayesiano (BLASSO) a partir de dados obtidos com espectroscopia na região infravermelho próximo (NIR) em diferentes tipos de amostras de cana-de-açúcar. Esses modelos foram construídos com o objetivo de predizer o teor de fibra (FIB), o teor de sacarose aparente (PC) e o teor de lignina (LIG). O conjunto de calibração foi composto por 166 clones e o de previsão por 20 clones. Os valores de FIB, PC e LIG variaram respectivamente de 8,36% a 22,53%, 1,78% a 16,89% e 13,79% a 21,08%. Os modelos RR- BLUP e BLASSO apresentaram coeficientes de correlação entre 0,70 e 0,91, valores superiores ou iguais aos dos modelos PLS, que por sua vez foram superiores aos dos modelos obtidos por PCR. Para predição de PC e FIB é aconselhável utilizar amostras de colmo devido ao maior poder preditivo além de ser mais viável devido à maior praticidade quando comparado com as amostras de bagaço. Foi possível construir um modelo eficiente para predizer LIG utilizando amostras de bagaço seco. Todos os modelos escolhidos apresentaram bom desempenho para ranquear os melhores clones de acordo com os caracteres em estudo, apresentando medidas elevadas de acurácia, medidas pequenas da taxa de falso positivo e boa precisão.Item Uma proposta para a construção de gráficos de controle por meio de componentes principais(Universidade Federal de Viçosa, 2015-02-24) Manuli, Rômulo César; Ribeiro Júnior, José Ivo; http://lattes.cnpq.br/1315697041807130Idealizados inicialmente por Shewhart, os gráficos de controle são ferramentas utilizadas para o monitoramento de processos. Quando o objetivo é controlar várias características de um mesmo processo, é recomendável a aplicação dos gráficos de controle multivariados, ou seja, gráficos que monitorem todas essas características simultaneamente. O objetivo deste trabalho foi elaborar uma proposta de um gráfico de controle multivariado construído por meio de componentes principais, sendo esta uma técnica de análise multivariada que reduz a dimensionalidade dos dados. Os componentes principais são indicados para o controle estatístico de processos multivariados que envolvam um conjunto de dados com grande número de variáveis correlacionadas. Para tanto, foram analisados 20 cenários compostos, cada um, por mil pares de valores simulados para as duas variáveis-resposta correlacionadas com as seguintes correlações: 0,1; 0,3; 0,5; 0,7 e 0,9. Em cinco dos vinte cenários avaliados, o processo encontrava-se sob controle estatístico. Nos demais quinze cenários, o processo se encontrava fora de controle estatístico, dos quais, cinco apresentavam deslocamento na média de controle, em outros cinco os processos apresentaram aumento no desvio-padrão de controle e, por fim, os cinco restantes cenários apresentaram alterações na média de controle e no desvio-padrão de controle, simultaneamente. Para o total dos vinte cenários, foram construídos gráficos de controle empregando a matriz de variâncias e covariâncias (sΣ), onde os 2 elementos são as variâncias de controle ( σ 01 e σ 02 ) e as covariâncias estipuladas para o estudo, a matriz de correlações (ρ), onde os elementos são obtidos a partir da matriz de variâncias e covariâncias (Σ) e, por último, a matriz de coeficientes de variação (Σ*), realizando a transformação dos dados. Nesta transformação, os dados, após serem padronizados com média zero e variância um, têm suas variâncias ponderadas pelos respectivos coeficientes de variação (CVs). Em todas as três propostas, as probabilidades dos alarmes falsos obtidas foram constantes e iguais ao valor teórico esperado de 0,0027. As probabilidades dos alarmes verdadeiros foram baixas em todos os casos. A matriz Σ mostrou-se superior às demais nos cenários onde ocorreu o deslocamento da média e no cenário onde ocorreu o deslocamento da média e o aumento da variabilidade, simultaneamente. Já no cenário onde ocorreu somente o aumento da variabilidade, as matrizes Σ e Σ* mostraram-se exatamente iguais. As correlações existentes entre as variáveis-resposta não influenciaram nas probabilidades dos alarmes falsos e verdadeiros. Assim, quando o objetivo do controle for apontar pequenos desvios na média de controle ou pequenos aumentos na variabilidade, nenhuma das três propostas são indicadas, pois não são poderosas para apontar pequenas oscilações do processo. Uma alternativa para aumentar o poder no apontamento destas pequenas oscilações é plotar esta nova variável criada em outros gráficos de controle, como EWMA e CUSUM, por exemplo. Esta nova variável é uma combinação das variáveis-resposta e pode ser plotada em outros gráficos univariados.