23º SINAPE - Simpósio Nacional de Probabilidade e Estatística

Dados do Trabalho


Título

DESEMPENHO DE LIGAÇOES ASSIMETRICAS E METODOS DE CORREÇAO PARA DADOS DESBALANCEADOS EM REGRESSAO BINARIA

Resumo

Na regressão binária, o desbalanceamento de dados refere-se à presença de valores zeros ou uns numa proporção significativamente maior do que os correspondentes valores uns ou zeros. Neste trabalho, estudamos dois métodos desenvolvidos para lidar com o desbalanceamento e comparamos eles com o uso de ligações assimétricas, especificamente trabalhamos com algumas ligações propostas em Lemonte e Bazán (2017) e Bazán et al. (2017). Os resultados mostram que esses métodos não corrigem adequadamente o viés nas estimativas dos coeficientes de regressão e que os modelos com ligações assimétricas potência e reversa de potência considerados produzem melhores resultados para certo tipo de desbalanceamento.
Adicionalmente, apresentamos uma aplicação para dados desbalanceados identificando o melhor modelo entre vários modelos propostos.
A estimação dos parâmetros é realizada sob abordagem bayesiana considerando o método de estimação Monte Carlo Hamiltoniano usando o algoritmo No-U-Turn Sampler e as comparações de modelos são desenvolvidas usando diferentes critérios de seleção de modelos.

Palavras-chave

assimetria, ligações assimétricas, desbalanceamento, regressão binária

Área

Modelos de Regressão

Autores

ALEX DE LA CRUZ HUAYANAY, JORGE LUIS BAZÁN GUZMÁN, VICENTE GARIBAY CANCHO