Discriminação de populações com diferentes graus de similaridade por redes neurais artificiais
Arquivos
Data
2009-12-15
Autores
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Viçosa
Resumo
A correta classificação de indivíduos em grupos pré-estabelecidos tem se tornado de grande importância no melhoramento genético. As técnicas de estatística multivariada usualmente utilizadas nesse tipo de problema são as funções discriminantes de Fisher e as funções discriminantes de Anderson, que são usadas para alocar um indivíduo inicialmente desconhecido em uma das g populações ou grupos pré-definidos. Nas últimas décadas vêm surgindo um novo paradigma de computação, as redes neurais artificiais, que podem ser utilizadas para resolver diversos problemas da Estatística, como agrupamento de indivíduos similares, previsão de séries temporais e em especial, os problemas de classificação. O objetivo dessa pesquisa foi realizar um estudo comparativo entre as funções discriminantes de Fisher e de Anderson e as redes neurais artificiais quanto ao número de classificações erradas de indivíduos sabidamente pertencentes a diferentes populações, com distintos níveis de dissimilaridade. Essa dissimilaridade, medida pela distância de Mahalanobis, foi um conceito de fundamental importância na utilização das técnicas de discriminação, pois quantificou o quanto as populações eram divergentes. Quanto maior o valor observado para essa medida, menos similares foram as populações em análise. A obtenção dos dados foi feita através de simulação utilizando o programa computacional Genes (CRUZ, 2006). As redes neurais artificiais apresentaram uma taxa de indivíduos rejeitados por serem considerados ambíguos quanto às suas características discriminatórias. No entanto, mostraram-se uma técnica promissora no que diz respeito a problemas de classificação, uma vez que apresentaram um número de classificações erradas de indivíduos menor que aqueles dados pelas funções discriminantes.
The correct classification of individuals in pre-established groups has become of great importance in breeding. The multivariate statistical techniques commonly used in this type of problem are the discriminant functions of Fisher and Anderson, which are used to allocate an initially unknown individual in one of the g populations or pre-defined groups. In recent decades a new computing paradigm, artificial neural networks, has come along to solve various problems of Statistics, such as grouping of similar individuals, time series forecasting and also of particular interest, the problem of classification. The objective of this research was to conduct a simulation study in order to compare the discriminant functions of Fisher and Anderson and neural networks. We evaluated the number of incorrect classifications of individuals known to belong to different populations with different levels of dissimilarity measured by the Mahalanobis distance. Simulations were conducted using the software Genes (Cruz, 2006). Although Artificial Neural Networks presented a rate of incorrect classification of individuals rejected for being considered ambiguous as to its discriminatory characteristics, it proved to be a promising technique, since it presented a lower number of incorrect classifications of individuals when compared to the discriminant functions.
The correct classification of individuals in pre-established groups has become of great importance in breeding. The multivariate statistical techniques commonly used in this type of problem are the discriminant functions of Fisher and Anderson, which are used to allocate an initially unknown individual in one of the g populations or pre-defined groups. In recent decades a new computing paradigm, artificial neural networks, has come along to solve various problems of Statistics, such as grouping of similar individuals, time series forecasting and also of particular interest, the problem of classification. The objective of this research was to conduct a simulation study in order to compare the discriminant functions of Fisher and Anderson and neural networks. We evaluated the number of incorrect classifications of individuals known to belong to different populations with different levels of dissimilarity measured by the Mahalanobis distance. Simulations were conducted using the software Genes (Cruz, 2006). Although Artificial Neural Networks presented a rate of incorrect classification of individuals rejected for being considered ambiguous as to its discriminatory characteristics, it proved to be a promising technique, since it presented a lower number of incorrect classifications of individuals when compared to the discriminant functions.
Descrição
Palavras-chave
Classificação, Análise discriminante, Redes neurais artificiais, Classification, Discriminant analysis, Artificial neural networks
Citação
PEREIRA, Tiago Martins. Discrimination of populations different degrees of similarity in artificial neural networks. 2009. 88 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa, 2009.