Dados do Trabalho
Título
K-MEANS E KERNEL K-MEANS: ALGORITMOS PARA CLUSTERIZAÇAO
Resumo
O principal objetivo da clusterização e, em geral, um agrupamento ou a segmentação de determinadas observações em sub-
grupos(clusters), considerando medidas de similaridade como critério de separação. Um dos exemplos clássicos é o K-Means
que utiliza a distância euclidiana entre as observações como medida de similaridade. Entretanto, este método tem em algumas
limitações, principalmente no que diz respeito a dados que não são linearmente separáveis. São utilizados então, Kernel
K-Means para contornar esse problema. Ambos métodos foram implementados no R, e como resultado, notou-se que além
de resolver bem a questão da falta da não linearidade o Kernel K-Means também apresenta sutis melhores resultados na
clusterização quando comparado ao K-Means clássico.
Palavras-chave
clusterização, aprendizado de máquina, não supervisionado, kernels
Área
Dados Funcionais, Dados em Alta Dimensão e Aprendizado Estatístico de Máquinas
Autores
Mateus Maia Marques, Anderson Luiz Souza Ara