Transformações de dados e análise de variância: teoria, técnicas e impactos

Imagem de Miniatura

Data

2024-12-16

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Viçosa

Resumo

A transformação de um conjunto de dados para outra escala matemática é uma técnica comum utilizada em análises estatísticas do tipo ANOVA, com o propósito de satisfazer os pressupostos de normalidade e homogeneidade de variâncias para tornar a análise de variância válida. Esta técnica começou a ser utilizada em 1898 por Edgeworth e permanece nas publicações científicas até os dias atuais. As transformações de dados em análises estatísticas, especialmente para modelos lineares, têm o objetivo de tornar os dados e os termos de erro do modelo mais próximos de uma distribuição normal, sendo possível utilizá-las para corrigir heterogeneidade de variâncias ou para tornar um modelo aditivo. Surgem questionamentos a respeito desta técnica, tais como: se a interpretação dos dados deve ser feita na nova escala, ou se deve ser aplicada a inversa da transformação para a interpretação ser realizada na escala original; se é mais adequado utilizar uma análise não paramétrica, que não necessita de pressuposições de normalidade e homogeneidade de variâncias. O principal objetivo deste estudo é avaliar a capacidade de correção da não normalidade e heterogeneidade de variâncias das principais transformações de dados utilizadas pela comunidade científica de ciências agrárias. Para isso, realizamos duas revisões sistemáticas de literatura de trabalhos que realizaram análise de variância e utilizaram transformações de dados para validar seus pressupostos, a primeira fornece uma noção de como a técnica vem sendo aplicada na área de ciências agrárias como um todo, e a segunda para investigar o uso da técnica em quatro de seus subcampos (entomologia, fitotecnia, florestal e solos). Ambas as revisões identificaram as transformações logarítmica, raiz quadrada, arco seno e Box-Cox como as mais utilizadas na área para a validação dos pressupostos da análise de variância, além de erros de execução e reporte da técnica. Com base nisso, realizamos um estudo de simulação para avaliar a eficácia dessas quatro transformações na correção da não normalidade e heterogeneidade, destacando a superioridade da transformação Box-Cox na correção simultânea dos pressupostos; elaboramos diretrizes práticas para orientar pesquisadores na execução da ANOVA; e por fim, desenvolvemos um aplicativo web para permitir que pesquisadores sem afinidade com programação possam ter acesso ao método de triagem que utilizamos nas revisões sistemáticas executadas. Palavras-chave: revisão sistemática; ciências agrárias; pressuposições da anova; simulação; diretrizes.
The transformation of a dataset to another mathematical scale is a common technique used in ANOVA-type statistical analyses, aimed at satisfying the assumptions of normality and homogeneity of variances to validate the analysis of variance. This technique began to be used in 1898 by Edgeworth and remains prevalent in scientific publications to this day. Data transformations in statistical analyses, particularly for linear models, aim to make the data and error terms of the model closer to a normal distribution. They can be employed to correct heterogeneity of variances or to make a model additive. Questions arise regarding this technique, such as whether data interpretation should be performed on the new scale or if the inverse transformation should be applied to interpret results on the original scale; or whether it is more appropriate to use a non-parametric analysis that does not require assumptions of normality and homogeneity of variances. The primary objective of this study is to assess the ability of the most commonly used data transformations in the agricultural sciences research community to correct non-normality and heterogeneity of variances. To this end, we conducted two systematic literature reviews of studies that performed analysis of variance and used data transformations to validate their assumptions. The first review provides an overview of how the technique has been applied in agricultural sciences as a whole, while the second focuses on its use in four subfields (entomology, crop science, forestry, and soil science). Both reviews identified logarithmic, square root, arcsine, and Box-Cox transformations as the most frequently used techniques for validating variance analysis assumptions, alongside errors in the execution and reporting of the technique. Based on these findings, we conducted a simulation study to evaluate the effectiveness of these four transformations in correcting non-normality and heterogeneity, highlighting the superiority of the Box-Cox transformation in simultaneously addressing both assumptions. We developed practical guidelines to assist researchers in conducting ANOVA and created a web application to provide access to our systematic review screening method for researchers with no programming expertise. Keywords: literature review; agrarian sciences; anova assumptions; simulation; guidelines.

Descrição

Palavras-chave

Análise de variância - Métodos de simulação, Unidades de medida, Agronomia - Estatísticas

Citação

NASCIMENTO, Jhennifer dos Santos. Transformações de dados e análise de variância: teoria, técnicas e impactos. 2024. 86 f. Tese (Doutorado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa. 2024.

Avaliação

Revisão

Suplementado Por

Referenciado Por