23º SINAPE - Simpósio Nacional de Probabilidade e Estatística

Dados do Trabalho


Título

IMPLICAÇOES DOS DADOS FALTANTES NOS QUESTIONARIOS CONTEXTUAIS DO SAEB 2015

Resumo

Este trabalho tem por objetivo apresentar a comparação dos principais métodos de imputação de
dados faltosos nos questionários contextuais do SAEB, 2015. Para tanto, procedeu-se com a
imputação dos dados ausentes a partir de diversos tipos de tratamentos. Foram considerados
cinco métodos de substituição de variáveis faltantes: “Pairwise”, “Listwise”, “Mean Imputation
(substituição pela média)”, Multiple Imputation (imputação múltipla) e “Imputação por
proporção”. O segundo passo foi a utilização de análises de regressão linear múltipla para
efetuar a comparação dos ajustes dos modelos, considerando as bases de dados com diferentes
métodos. Os resultados indicaram o método que melhor se ajustou aos dados nas três disciplinas
avaliadas, foi o de imputação múltipla, onde apresentou o maior R² ajustado de 20,57% em
língua portuguesa. Em seguida, estão os métodos Substituição pela Média e Listwise que se
ajustaram bem aos dados de ambas as disciplinas e matemática com R² ajustado de 15,71% e
14,41% respectivamente.

Palavras-chave

SAEB, Tratamento de Dados, Dados ausentes, Métodos de imputação, Regressão múltipla.

Área

Modelos de Regressão

Autores

Gesiane Socorro Andrade Leão Farias, Josemberg Moura de Andrade, Gabriel Ravi Sousa Santos, Aline Fernades de Paula Freitas