K-means es un algoritmo propuesto por MacQueen en 1967 que plantea el agrupamiento de elementos de datos en torno a centroids aleatorios en forma de subgrupos conteniendo puntos de datos, a medida de minimizar el criterio de suma de cuadrados como vemos en la ecuación ()
donde es un vector representando el -esimo punto de dato
y, es el centroid geométrico de los puntos de datos
.9 (Véase el algoritmo 10)
El algoritmo puede ser afectado significativamente por el inicio aleatorio de los centros, por lo tanto puede ser llevado acabo varias veces para minimizar el efecto. El problema se encuentra en que el algoritmo no logra el objetivo del mínimo global de sobre las asignaciones.
julio 2010-03-26