23º SINAPE - Simpósio Nacional de Probabilidade e Estatística

Dados do Trabalho


Título

SOBRE SELEÇAO ESTATISTICA DE ARVORES DE CONTEXTO

Resumo

Os modelos de árvores de contexto (MAC) foram introduzidos primeiramente em Teoria da Informação por Rissanen (1983) como uma generalização parcimoniosa dos modelos Markovianos. Desde então, eles tem sido utilizados amplamente em probabilidade aplicada e estatística sendo que recentemente vem sendo aplicados na modelagem de dados em diferentes áreas científicas tais como biologia, linguística e música. A ideia por trás dos MAC é que para cada passado, somente um sufixo finito do passado, chamado contexto, é suficiente para definir probabilisticamente o próximo símbolo. Os processos estocásticos, definidos sobre um alfabeto finito, que permitem uma representação de árvore de contexto são chamados cadeias com memória de tamanho variável (CMTV). Dada uma amostra desta cadeia, a estimação da árvore de contexto e das probabilidades de transição que geram a sequência de símbolos da amostra é uma questão amplamente tratada na literatura. Historicamente, esta estimação é realizada sobre diferentes versões do Algoritmo Contexto, também introduzido por Rissanen, e que seleciona a menor árvore capaz de gerar a amostra. Neste sentido, apresentamos neste trabalho uma descrição sucinta a respeito de tais algoritmos e exploramos a questão da consistência destes estimadores.

Palavras-chave

Árvores de Contexto; Algoritmo Contexto; Seleção de Modelo; Estimação Consistente.

Área

Probabilidade e Processos Estocásticos

Autores

Ricardo Ferreira, Daniel Takahashi, Sandro Gallo