Comparação das funções de ligação logit e probit em regressão binária considerando diferentes tamanhos amostrais

Imagem de Miniatura

Data

2013-02-20

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Viçosa

Resumo

Considerou-se um estudo de regressão binária por meio as funções de ligação logit e probit visando verificar a robustez das funções de ligação diante da variação do tamanho da amostra. Estas funções de ligação utilizam, respectivamente, as distribuições acumuladas logística e normal, sendo a principal diferença entre elas os valores de probabilidades nos extremos da variável independente. Dentro desse contexto, foram realizadas simulações com 500 repetições utilizando amostras de 10 diferentes tamanhos, desde 10 a 91, com uma diferença entre as sucessivas amostras de 9 unidades. As medidas de desempenho percentual de convergência, erro quadrático médio da probabilidade geral, erro quadrático médio da probabilidade específica, teste Wald para os coeficientes, foram utilizadas para estabelecer uma recomendação para o uso das duas diferentes funções de ligação quando os dados foram gerados com o uso do logit e probit e analisados por ambas as funções de ligação em cada tamanho de amostra. Concluiu-se que o objetivo desse trabalho foi atingido ao estabelecer uma recomendação para o uso da função de ligação logit para tamanhos inferiores a 20 devido a maior taxa de convergência, ou seja, foi verificado com a utilização da função de ligação logit que há um maior número de amostras em que foi possível estimar os parâmetros da regressão binaria. Para maiores tamanhos de amostras, utilizando as demais medidas de desempenho, tanto o logit como o probit mostraram-se semelhantes, pois não foram encontradas diferenças significativas entre esses dois tipos de funções.
It was considered a binary regression analysis with the logit and probit link function in order to verify the link functions robustness in sample size variation. These link functions apply, respectively, the cumulative distributions logistics and normal, and the probabilistic main difference values of independent variable extremes. Then, simulations were performed with 500 replicates using 10 different sizes samples, from 10 to 91, with 9 successively units between the samples. Performance convergence percentage measures, general probabilistic average squared error, specific probabilistic average squared error and coefficients Wald test were used to establish a specific use recommendation for the two different link functions just when data were generated with logit and probit use and analyzed with the both link functions in each sample size. It was concluded that the work aim was achieved by establishing a recommendation for the logit link function use for sizes below 20 due to higher convergence rate, ie, it was verified with logit link function that there is a greater number of samples which was possible to estimate the binary regression parameters. For larger sample sizes, using other performance measures, both, the logit and probit, were similar, as there were no significant differences between these two different functions.

Descrição

Palavras-chave

Regressão logística, Regressão probit, Simulação de dados, Logistic regression, Probit regression, Data simulation

Citação

FREITAS, Leillimar dos Reis. Comparison of logit and probit link functions in regression binary considering different sample sizes. 2013. 54 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa, 2013.

Avaliação

Revisão

Suplementado Por

Referenciado Por