Use este identificador para citar ou linkar para este item: https://locus.ufv.br//handle/123456789/4065
Tipo: Dissertação
Título: Avaliação de agrupamentos em mistura de variáveis
Título(s) alternativo(s): Evaluation of cluster variables in a mixture
Autor(es): Vidigal, Bruno Caetano
Primeiro Orientador: Cecon, Paulo Roberto
Primeiro coorientador: Nascimento, Moysés
Segundo coorientador: Cruz, Cosme Damião
Primeiro avaliador: Ferreira, Adésio
Abstract: A análise de agrupamento é amplamente utilizada em muitas áreas de pesquisa a fim de se reconhecer uma estrutura padrão de variabilidade entre os indivíduos ou objetos estudados, classificando-os em grupos homogêneos. No entanto, dos trabalhos publicados, a maioria deles versam apenas sobre variáveis numéricas, excluindo da análise, as informações contidas nas variáveis categóricas. Dessa forma, esse trabalho teve o objetivo de avaliar várias formas de agrupamentos em um banco de dados simulado e também de disponibilizar uma rotina em R do algoritmo kprotótipos e uma rotina para se realizar agrupamentos hierárquicos. As medidas de distâncias avaliadas foram: euclidiana, euclidiana ao quadrado, euclidiana média, mahalanobis, manhattan, medidas combinadas e a de gower. Quanto aos algoritmos de agrupamento hierárquicos utilizados foram: vizinho mais próximo, vizinho mais distante, UPGMA e ward . Os algoritmos não-hierárquicos foram: k-médias e o kprotótipos. Os resultados obtidos foram confrontados entre si e concluiu-se que os algoritmos não-hierárquicos foram superiores aos hierárquicos e que incluir variáveis categóricas na análise é viável.
Cluster analysis is widely used in many research areas in order to recognize a standard structure of variability between individuals or objects studied, classifying them into homogeneous groups. However, the studies that are published, most of them deal only on numeric variables, excluding the analysis, the information contained in categorical variables. Thus, this study aims to evaluate some similarity measures and clustering algorithms in databases and also simulated on a case study in Genetics. The similarity measures evaluated were: euclidean, squared euclidean, mean euclidean, mahalanobis, manhattan, combined measures and gower. The hierarchical clustering algorithms are: nearest neighbor, furthest neighbor, UPGMA and Ward. The algorithms evaluated from the class of non-hierarchical are the kmeans and k-prototypes, which is an extension of the first. The results were compared and we concluded the non-hierarquical were better than hierarquical methods.
Palavras-chave: Análise de agrupamentos
Simulação
Algoritmos
Cluster analysis
Simulation
Algorithms
CNPq: CNPQ::CIENCIAS AGRARIAS
Idioma: por
País: BR
Editor: Universidade Federal de Viçosa
Sigla da Instituição: UFV
Departamento: Estatística Aplicada e Biometria
Citação: VIDIGAL, Bruno Caetano. Evaluation of cluster variables in a mixture. 2013. 69 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa, 2013.
Tipo de Acesso: Acesso Aberto
URI: http://locus.ufv.br/handle/123456789/4065
Data do documento: 6-Fev-2013
Aparece nas coleções:Estatística Aplicada e Biometria

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
texto completo.pdf747,21 kBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.