23º SINAPE - Simpósio Nacional de Probabilidade e Estatística

Dados do Trabalho


Título

REDUÇAO DE VIES NA ESTIMAÇAO USANDO DADOS PAREADOS

Resumo

O uso de técnicas de pareamento para integrar dados de duas ou mais fontes se popularizou nos últimos 20 anos. Se por um lado vimos o aprimoramento do método probabilístico proposto por Fellegi e Sunter e o deselvolvimento de uma variedade de outros métodos; por outro, a negligência dos erros de pareamento e de seus impactos na qualidade das estimativas derivadas se asseverou. Soluções que levam em consideração alguma medida de erro de pareamento para a correção de viés na estimação utilizando dados pareados vêm sendo propostas, mas ainda não foram incorporadas na prática cotidiana dos usuários de dados pareados, então muitas análises baseadas em dados pareados são potencialmente enganosas. Um estudo empírico, incluindo pareamento de dados de estabelecimentos agropecuários e estimação de valores da produção agropecuária revela a presença de viés devido ao pareamento e mostra o desempenho de métodos de regressão que reduzem tal viés. Foram utilizados dados do Cadastro Central de Empresas do IBGE e da Secretaria Estadual de Fazenda dos Estados do Ceará, Maranhão, Paraíba e Santa Catarina. Dois métodos de pareamento foram utilizados (Fellegi-Sunter e árvores de classificação), para dois níveis de erro nos dados. Foi realizado pareamento completo (dados censitários) e incompleto (dados amostrais). Três métodos de estimação foram comparados: mínimos quadrados ordinários (MQO), melhor estimador linear não-viesado (BL) e máxima verossimilhança (EMV). Os resultados correspondem a valores médios em 200 simulações. Foi observado viés em todos os cenários de pareamento, sendo, na maioria dos casos, menor quando os dados pareados resultam do método baseado em árvores de classificação e quando o nível de erro é menor. Para o pareamento completo o BL leva ao menor erro quadrático médio sempre que o nível de erro é maior; e para o pareamento incompleto tal medida é sempre menor quando utilizado o EMV.

Palavras-chave

Estatísticas agropecuárias; pareamento; Fellegi-Sunter; árvore de classificação; estimação; modelo de regressão.

Área

Estatística Aplicada em Ciências Sociais Aplicadas e Demografia e Estatísticas Públicas

Autores

Andrea Diniz da Silva, Ray Chambers, José André Moura Brito