23º SINAPE - Simpósio Nacional de Probabilidade e Estatística

Dados do Trabalho


Título

K-MEANS E KERNEL K-MEANS: ALGORITMOS PARA CLUSTERIZAÇAO

Resumo

O principal objetivo da clusterização e, em geral, um agrupamento ou a segmentação de determinadas observações em sub-
grupos(clusters), considerando medidas de similaridade como critério de separação. Um dos exemplos clássicos é o K-Means
que utiliza a distância euclidiana entre as observações como medida de similaridade. Entretanto, este método tem em algumas
limitações, principalmente no que diz respeito a dados que não são linearmente separáveis. São utilizados então, Kernel
K-Means para contornar esse problema. Ambos métodos foram implementados no R, e como resultado, notou-se que além
de resolver bem a questão da falta da não linearidade o Kernel K-Means também apresenta sutis melhores resultados na
clusterização quando comparado ao K-Means clássico.

Palavras-chave

clusterização, aprendizado de máquina, não supervisionado, kernels

Área

Dados Funcionais, Dados em Alta Dimensão e Aprendizado Estatístico de Máquinas

Autores

Mateus Maia Marques, Anderson Luiz Souza Ara