Dados do Trabalho
Título
SOBRE SELEÇAO ESTATISTICA DE ARVORES DE CONTEXTO
Resumo
Os modelos de árvores de contexto (MAC) foram introduzidos primeiramente em Teoria da Informação por Rissanen (1983) como uma generalização parcimoniosa dos modelos Markovianos. Desde então, eles tem sido utilizados amplamente em probabilidade aplicada e estatística sendo que recentemente vem sendo aplicados na modelagem de dados em diferentes áreas científicas tais como biologia, linguística e música. A ideia por trás dos MAC é que para cada passado, somente um sufixo finito do passado, chamado contexto, é suficiente para definir probabilisticamente o próximo símbolo. Os processos estocásticos, definidos sobre um alfabeto finito, que permitem uma representação de árvore de contexto são chamados cadeias com memória de tamanho variável (CMTV). Dada uma amostra desta cadeia, a estimação da árvore de contexto e das probabilidades de transição que geram a sequência de símbolos da amostra é uma questão amplamente tratada na literatura. Historicamente, esta estimação é realizada sobre diferentes versões do Algoritmo Contexto, também introduzido por Rissanen, e que seleciona a menor árvore capaz de gerar a amostra. Neste sentido, apresentamos neste trabalho uma descrição sucinta a respeito de tais algoritmos e exploramos a questão da consistência destes estimadores.
Palavras-chave
Árvores de Contexto; Algoritmo Contexto; Seleção de Modelo; Estimação Consistente.
Área
Probabilidade e Processos Estocásticos
Autores
Ricardo Ferreira, Daniel Takahashi, Sandro Gallo