Análise de variáveis canônicas no software R

Imagem de Miniatura

Data

2020-10-26

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Viçosa

Resumo

As variáveis canônicas (𝑉𝐶𝑠) são combinações lineares de variáveis quantitativas utilizadas na discriminação de grupos. No contexto de experimentos executados com tratamentos repetidos sob diferentes delineamentos de casualização, a obtenção das 𝑉𝐶𝑠 pressupõe a realização da MANOVA, uma vez que elas são obtidas pela maximização da relação entre a variação entre e dentro dos tratamentos utilizando, respectivamente, as matrizes de soma de quadrados e produtos do tratamento (𝑯) e do resíduo (𝑬). Funções discriminantes lineares de Fisher (𝐹𝐷𝑠), por outro lado, são combinações lineares de variáveis cujo principal objetivo é a classificação de observações em populações distintamente estabelecidas e conhecidas a priori. Uma vez que existe uma equivalência matemática para obtenção das 𝐹𝐷𝑠 e das 𝑉𝐶𝑠, a obtenção das 𝑉𝐶𝑠 pode ser facilitada pela obtenção de 𝐹𝐷𝑠, que é um método mais comumente encontrado em softwares estatísticos. Neste sentido, o objetivo deste trabalho foi de analisar, por meio da simulação de dados, a equivalência entre as 𝐹𝐷𝑠 e as 𝑉𝐶𝑠, a partir de experimentos instalados sob o DIC, DBC e DQL. A obtenção das 𝑉𝐶𝑠 por meio das 𝐹𝐷𝑠 foi realizada utilizando a função 𝑙𝑑𝑎 implementada no software R com o uso dos valores transformados das observações de cada variável-resposta pela subtração dos efeitos perturbadores (ou seja, de bloco para o DBC, ou de linha e coluna para o DQL) quando eles existiam no modelo estatístico. Além disso, duas padronizações foram utilizadas na obtenção das 𝑉𝐶𝑠. Os resultados proporcionados por ambos os métodos foram comparados por diferentes medidas que incluíram, autovetores, autovalores, importância relativa, além de correlações e da análise de variância e inspeção visual de gráficos bidimensionais, e comprovaram a similaridade das 𝑉𝐶𝑠 com as 𝐹𝐷𝑠, uma vez que não houve prejuízo nem na interpretabilidade nem nas análises realizadas com ambas as funções lineares. Conclui- se, portanto, que as 𝑉𝐶𝑠 podem ser eficientemente obtidas por meio das 𝐹𝐷𝑠 com o uso da função 𝑙𝑑𝑎 e ambos os métodos são equivalentes. Palavras-chave: Análise multivariada. Delineamentos experimentais. Análise discriminante.
Canonical variables (𝑉𝐶𝑠) are linear combinations of quantitative variables used to discriminate groups. In the context of experiments performed with repeated treatments under different randomization designs, obtaining the 𝑉𝐶𝑠 presupposes the realization of MANOVA, since they are obtained by maximizing the relationship between the variance among and within the treatments using, respectively, the matrices of sum squares and sum products of treatments (𝑯) and residues (𝑬). Fisher's linear discriminating functions (𝐹𝐷𝑠), on the other hand, are linear combinations of variables whose main objective is the classification of observations in distinctly established and a priori known populations. Since there is a mathematical equivalence for obtaining 𝐹𝐷𝑠 and VCs, obtaining 𝑉𝐶𝑠 can be facilitated by obtaining 𝐹𝐷𝑠, which is a method most found in statistical software. In this sense, the objective of this work was to analyze, through data simulation, the equivalence between 𝐹𝐷𝑠 and 𝑉𝐶𝑠, based on experiments installed under DIC, DBC and DQL. The acquisition of 𝑉𝐶𝑠 by means of 𝐹𝐷𝑠 was performed using the 𝑙𝑑𝑎 function implemented in software R and using the transformed values of the observations of each response variable by subtracting the disturbing effects (that is, from block to DBC, or from row and column for DQL) when they existed in the statistical model. In addition, two normalizations were used for the eigenvectors. The results provided by both methods were compared by different measures that included, eigenvectors, eigenvalues, relative importance, in addition to correlations and analysis of variance and visual inspection of bi-dimensional graphs and proved the similarity of the 𝑉𝐶𝑠 with the 𝐹𝐷𝑠. This is because there was no impairment in either interpretability or analysis performed with both linear functions. It is concluded, therefore, that 𝑉𝐶𝑠 can be efficiently obtained by means of 𝐹𝐷𝑠 using the 𝑙𝑑𝑎 function and both methods are similar. Keywords: Multivariate analysis. Experimental designs. Discriminant analysis.

Descrição

Palavras-chave

Análise multivariada, Delineamento experimental, Análise de variância, Autovalores, Funções algébricas

Citação

BARBOSA, Wagner Faria. Análise de variáveis canônicas no software R. 2020. 73 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa. 2020.

Avaliação

Revisão

Suplementado Por

Referenciado Por