Testes estatísticos em regressão logística sob a condição de separabilidade

Imagem de Miniatura

Data

2010-02-25

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Viçosa

Resumo

A regressão logística é o método estatístico usual de análise utilizado quando o objetivo é verificar a relação entre uma variável resposta dicotômica e variáveis explicativas de interesse. Usualmente, os parâmetros deste modelo são estimados pelo método de máxima verossimilhança genuína, e testes sobre estes parâmetros são construídos considerando as distribuições aproximadas dos estimadores. Isto significa que amostras grandes tornam-se necessárias para obter resultados mais confiáveis. Em estudos envolvendo dados binários, é frequente a presença de uma variável resposta cujo sucesso é pouco provável, ou seja, tem-se um evento raro, o que pode gerar uma amostra de dados esparsos. Nestes casos, diz-se que os dados podem estar sob a condição de separabilidade, e esta situação está frequentemente associada à presença de uma covariável categórica, podendo os estimadores de máxima verossimilhança, para pelo menos um parâmetro, não existir. Na situação de separabilidade recomenda-se utilizar o método de máxima verossimilhança penalizada proposto por Firth (1993). O objetivo principal deste trabalho foi verificar por meio de simulação Monte Carlo os poderes dos testes da razão de verossimilhanças (TRV) e de Wald obtido via máxima verossimilhança penalizada na condição de separabilidade. A metodologia apresentada neste trabalho foi aplicada a dois conjuntos de dados reais. A simulação Monte Carlo com uma variável explicativa no modelo possibilitou obter indicativos que o TRV tem maior poder que o teste de Wald.
Logistic regression is the statistical method of analysis used when the objective is to verify the relationship between one dichotomic response variable and explicative variables of interest. Usually, the model parameters are estimated through the genuine maximum likelihood method, and tests about these parameters are built assuming approximated distributions for the estimators. This means that large samples become necessary to obtain trustable results. In studies involving binary data is common the occurrence of one response variable whose success has low probability, in other words, a rare event that can generate a sparse data sample. In such cases, the data are under separability condition, and this situation is frequently associated to the presence of one categorical co-variable, what means that the maximum likelihood estimators do not exist to one parameter at least. In the separability condition it is recommended to use the Penalized Maximum Likelihood method, proposed by Firth (1993). The main objective of this study was to verify the powers of the Likelihood Ratio Test (LRT) and Wald Test obtained through PML under separability condition by Monte Carlo simulation. The presented methodology has been applied to two real data sets. Monte Carlo simulation with one explicative variable in the model made possible to obtain indicatives that the LRT is most powerful than the Wald test.

Descrição

Palavras-chave

Máxima Verossimilhança Penalizada, Simulação, Teste da Razão de Verossimilhança, Teste de Wald, Penalizmmed Maximum Likelihood, Simulation, Likelihood Ratio Test, Wald test

Citação

SOUZA, André Oliveira. Statistical tests in logistic regression under separability condition. 2010. 77 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa, 2010.

Avaliação

Revisão

Suplementado Por

Referenciado Por