23º SINAPE - Simpósio Nacional de Probabilidade e Estatística

Dados do Trabalho


Título

ALGORITMOS PARA PREDIÇAO DE PROCESSOS MOVIDOS CONTRA GRANDES LITIGANTES

Resumo

Empresas envolvidas como réu em um alto número de ações são conhecidas como grandes litigantes, entre elas estão bancos e prestadoras de serviços de telefonia. Dado o atual grande número de processos em trâmite, a presente pesquisa visa auxiliar a estratégia utilizada pelo autor da ação, a fim de diminuir a quantidade e o tempo das ações. A base de dados utilizada tem origem na Consulta de Processos de Primeiro Grau do Tribunal de Justiça de São Paulo e é composta de sentenças, homologadas em 2014, em primeira instância de processos movidos contra grandes litigantes e é composta por 12.616 observações e 12 variáveis, sendo o resultado da ação a variável resposta. Para tanto, são propostos modelos preditivos, baseados na distribuição multinomial e no support vector machine (SVM) com kernel gaussiano. Os modelos baseados na distribuição multinomial são ajustados pelo método da máxima verossimilhança e a avaliação de características relevantes é feita pelo teste de razão de verossimilhanças. Os resultados do ajuste desse modelo mostraram que empresa envolvida, foro, tipo de vara e dano, indicativos de presença de advogado do réu, discussões a respeito dos órgãos de proteção ao crédito, presença da palavra “terceiro”, discussões a respeito de relação de consumo e a respeito de gratuidade judiciária são características relevantes para o resultado da ação. O modelo obteve acurácia 53% na base de teste. Já o método baseado em SVM é construído pela interpretação geométrica do problema, dispondo as observações em um hiperplano e maximizando as margens do subespaço desse hiperplano que melhor separam as observações. Para este método foram consideradas todas as covariáveis da base de dados e obteve-se uma acurácia de 54% na base de teste. Ambas as abordagens apresentaram desempenhos similares, isso indica que o problema para classificação das ações é devido à característica dos dados, que apresentam covariáveis muito similares para diferentes resultados.

Palavras-chave

Distribuição Multinomial, Jurimetria, Predição, Support Vector Machine

Área

Dados Funcionais, Dados em Alta Dimensão e Aprendizado Estatístico de Máquinas

Autores

Jhenifer Caetano Veloso, Eduardo Elias Ribeiro Junior