Testes F e de normalidade avaliados sob diferentes condições experimentais
Arquivos
Data
2023-02-17
Autores
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Viçosa
Resumo
A pressuposição de normalidade dos erros experimentais é uma das exigências que se impõe para a aplicação de importantes procedimentos inferenciais, como o teste F da Análise de Variância (ANOVA), muito empregada em diversos campos científicos, como as Ciências Agrárias. Nesse sentido, resultados importantes e conhecidos da Estatística, como o Teorema Central do Limite, não impõem, teoricamente, muitas dificuldades para se obter, a partir de praticamente qualquer variável aleatória não normal, uma nova variável aleatória, que seja normal, com a finalidade de não violar essa pressuposição. No entanto, por questões de ordem prática, nem sempre é possível obter um número de repetições por tratamento suficientemente elevado para que o Teorema supracitado seja aplicado. Assim, algumas das alternativas mais empregadas são os testes de normalidade, para, com quantidades limitadas de observações amostrais, inferir a respeito da normalidade dos dados. Porém, as efetividades desses testes, assim como de outros testes de hipóteses, em termos de poder (probabilidade de rejeitar uma hipótese nula falsa) e nível de significância (probabilidade de rejeitar uma hipótese nula verdadeira cometendo o erro tipo I), são influenciadas pelas condições experimentais. Por isso, este trabalho foi realizado com o objetivo de comparar o desempenho dos testes de normalidade mais comuns em condições de igualdade (desigualdade) das médias dos tratamentos, homogeneidade (heterogeneidade) de suas variâncias residuais, número de repetições de cada um e simetria (assimetria) das distribuições de probabilidades dos erros experimentais. Foi possível também analisar o desempenho do próprio teste F, inclusive quando a pressuposição de normalidade foi violada. De maneira geral, foi possível concluir, ao realizar simulações, que o poder empírico dos testes de normalidade tende a cair quando a distribuição empírica dos erros experimentais é simétrica e o número total de observações é muito baixo, e que as taxas de erro tipo I, tanto dos testes de normalidade, quanto do teste F, tendem a aumentar quando as variâncias residuais dos tratamentos são heterogêneas. Palavras-chave: Testes de Hipóteses. Nível de Significância. Erro Tipo I. Erro tipo II. Análise de Variância (ANOVA). Delineamento Inteiramente Casualizado (DIC). Distribuição Normal. Erros Experimentais.
The assumption of normality of experimental errors is one of the requirements imposed for the application of important inferential procedures, such as the F test of Analysis of Variance (AOV), widely used in several scientific fields, such as Agricultural Sciences. In this sense, well-known statistics results, such as the Central Limit Theorem, do not theoretically impose many difficulties to obtain, from practically any non-normal random variable, a new random variable, which is normal, with the purpose to attend this assumption. However, due to practical reasons, it is not always possible to obtain a sufficiently high number of repetitions per treatment to apply this Theorem. Thus, some of the most used alternatives are the normality tests, to, with limited amounts of sample observations, infer about the normality of the data. But, the effectiveness of these tests, as well as other hypothesis tests, in terms of power (probability of rejecting a false null hypothesis) and significance level (probability of rejecting a true null hypothesis, type I error), are influenced by the experimental conditions. Therefore, this work was carried out with the objective of comparing the performance of the most common normality tests under conditions of equality (inequality) of the means of the treatments, homogeneity (heterogeneity) of their residual variances, number of repetitions of each one and symmetry (asymmetry) of experimental errors probability distributions. It was also possible to analyze the performance of the F test itself, when the assumption of normality was violated. In general, it was possible to conclude, when performing simulations, that the empirical power of normality tests tends to drop when the empirical distribution of experimental errors is symmetrical and the total number of observations is very low, and that Type I error rates, both for the normality tests and for the F test, tend to increase when the residual variances of the treatments are heterogeneous. Keywords: Hypothesis Tests. Significance Level. Type I error. Type II error. Analysis of Variance (ANOVA). Completely Randomized Design (CRD). Normal Distribution. Experimental Errors.
The assumption of normality of experimental errors is one of the requirements imposed for the application of important inferential procedures, such as the F test of Analysis of Variance (AOV), widely used in several scientific fields, such as Agricultural Sciences. In this sense, well-known statistics results, such as the Central Limit Theorem, do not theoretically impose many difficulties to obtain, from practically any non-normal random variable, a new random variable, which is normal, with the purpose to attend this assumption. However, due to practical reasons, it is not always possible to obtain a sufficiently high number of repetitions per treatment to apply this Theorem. Thus, some of the most used alternatives are the normality tests, to, with limited amounts of sample observations, infer about the normality of the data. But, the effectiveness of these tests, as well as other hypothesis tests, in terms of power (probability of rejecting a false null hypothesis) and significance level (probability of rejecting a true null hypothesis, type I error), are influenced by the experimental conditions. Therefore, this work was carried out with the objective of comparing the performance of the most common normality tests under conditions of equality (inequality) of the means of the treatments, homogeneity (heterogeneity) of their residual variances, number of repetitions of each one and symmetry (asymmetry) of experimental errors probability distributions. It was also possible to analyze the performance of the F test itself, when the assumption of normality was violated. In general, it was possible to conclude, when performing simulations, that the empirical power of normality tests tends to drop when the empirical distribution of experimental errors is symmetrical and the total number of observations is very low, and that Type I error rates, both for the normality tests and for the F test, tend to increase when the residual variances of the treatments are heterogeneous. Keywords: Hypothesis Tests. Significance Level. Type I error. Type II error. Analysis of Variance (ANOVA). Completely Randomized Design (CRD). Normal Distribution. Experimental Errors.
Descrição
Palavras-chave
Análise de variância, Hipóteses, Testes
Citação
RIBEIRO NETO, Homero. Testes F e de normalidade avaliados sob diferentes condições experimentais. 2023. 56 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa. 2023.