Estatística Aplicada e Biometria

URI permanente para esta coleçãohttps://locus.ufv.br/handle/123456789/195

Navegar

Resultados da Pesquisa

Agora exibindo 1 - 2 de 2
  • Imagem de Miniatura
    Item
    Análise de variáveis canônicas no software R
    (Universidade Federal de Viçosa, 2020-10-26) Barbosa, Wagner Faria; Ribeiro Júnior, José Ivo; http://lattes.cnpq.br/7238720100539414
    As variáveis canônicas (𝑉𝐶𝑠) são combinações lineares de variáveis quantitativas utilizadas na discriminação de grupos. No contexto de experimentos executados com tratamentos repetidos sob diferentes delineamentos de casualização, a obtenção das 𝑉𝐶𝑠 pressupõe a realização da MANOVA, uma vez que elas são obtidas pela maximização da relação entre a variação entre e dentro dos tratamentos utilizando, respectivamente, as matrizes de soma de quadrados e produtos do tratamento (𝑯) e do resíduo (𝑬). Funções discriminantes lineares de Fisher (𝐹𝐷𝑠), por outro lado, são combinações lineares de variáveis cujo principal objetivo é a classificação de observações em populações distintamente estabelecidas e conhecidas a priori. Uma vez que existe uma equivalência matemática para obtenção das 𝐹𝐷𝑠 e das 𝑉𝐶𝑠, a obtenção das 𝑉𝐶𝑠 pode ser facilitada pela obtenção de 𝐹𝐷𝑠, que é um método mais comumente encontrado em softwares estatísticos. Neste sentido, o objetivo deste trabalho foi de analisar, por meio da simulação de dados, a equivalência entre as 𝐹𝐷𝑠 e as 𝑉𝐶𝑠, a partir de experimentos instalados sob o DIC, DBC e DQL. A obtenção das 𝑉𝐶𝑠 por meio das 𝐹𝐷𝑠 foi realizada utilizando a função 𝑙𝑑𝑎 implementada no software R com o uso dos valores transformados das observações de cada variável-resposta pela subtração dos efeitos perturbadores (ou seja, de bloco para o DBC, ou de linha e coluna para o DQL) quando eles existiam no modelo estatístico. Além disso, duas padronizações foram utilizadas na obtenção das 𝑉𝐶𝑠. Os resultados proporcionados por ambos os métodos foram comparados por diferentes medidas que incluíram, autovetores, autovalores, importância relativa, além de correlações e da análise de variância e inspeção visual de gráficos bidimensionais, e comprovaram a similaridade das 𝑉𝐶𝑠 com as 𝐹𝐷𝑠, uma vez que não houve prejuízo nem na interpretabilidade nem nas análises realizadas com ambas as funções lineares. Conclui- se, portanto, que as 𝑉𝐶𝑠 podem ser eficientemente obtidas por meio das 𝐹𝐷𝑠 com o uso da função 𝑙𝑑𝑎 e ambos os métodos são equivalentes. Palavras-chave: Análise multivariada. Delineamentos experimentais. Análise discriminante.
  • Imagem de Miniatura
    Item
    Data-driven Cluster Analysis Method: uma nova metodologia para detecção de outliers em dados multivariados
    (Universidade Federal de Viçosa, 2021-04-20) Barbosa, Josino José; Oliveira, Fernando Luiz Pereira de; http://lattes.cnpq.br/1948800098593563
    Metodologias para identificação de outliers multivariados são de grande importância em análise estatística. Observações aberrantes podem revelar informações relevantes para variáveis sob investigação. Aplicações estatís- ticas sem uma prévia identificação de possíveis valores extremos podem apresentar resultados controversos e induzir decisões equivocadas. Além disso, em diversos contextos, os outliers são pontos de grande interesse prático e sua identificação torna-se o principal objetivo. Diante disso, esse estudo tem por objetivo propor uma nova técnica de detecção de outliers multivariados baseada em análise de agrupamentos. A técnica considera informações inerentes ao próprio banco de dados e também informações de conhecimento prévio do pesquisador acerca das populações sob investigação. A avaliação da metodologia foi conduzida através de calibração e comparação com três métodos de detecção já difundidos por meio de dados simulados. A investigação comparativa considera duas técnicas de detecção baseadas na clássica distância de Mahalanobis e uma técnica também baseada em análise de agrupamentos. As medidas de sensibilidade, especificidade e acurácia são utilizadas para aferir a qualidade dos métodos, assim como uma análise quanto ao tempo computacional necessário para a execução dos procedimentos. Além disso, os métodos foram empregados num conjunto de dados reais. A nova técnica proposta revelou uma notória superioridade em relação às demais, tanto na qualidade de detecção de outliers através dos dados simulados, quanto na adequabilidade na aplicação do conjunto de dados reais. Palavras-chave: Outliers multivariados. Simulação. Análise de agrupamentos. DDCAM.