Otras denominaciones: Análisis clúster, clasificación automática o no supervisada.

Objetivos: Clasificar a los individuos de un colectivo en grupos, denominados conglomerados o cluster, en función de las similitudes existentes en las puntuaciones que éstos presentan en un conjunto de variables, de forma que las observaciones pertenecientes a un grupo sean similares entre sí (homogeneidad dentro del grupo) y diferentes del resto (heterogeneidad entre grupos).

Tipo de técnica: Exploratoria, multivariante, de interdependencia y de agrupación.

Información de partida: Una matriz formada por las puntuaciones de \(p\) variables clasificadoras para los \(n\) individuos que se desean agrupar, siendo \(n\) el número de filas de la matriz y \(p\) el número de columnas.

Ejemplos: En general se puede usar cuando se trata de agrupar individuos con ciertas similitudes respecto a un conjunto de variables. Por ejemplo, para agrupar consumidores teniendo en cuenta preferencias similares, clasificar regiones en función de diversas variables económicas, determinar grupos de empresas según su riesgo financiero, etc. En el caso práctico resuelto se pretende identificar grupos de comunidades autónomas que tengan un comportamiento similar en un conjunto de indicadores económicos propuestos. En el caso propuesto, con el mismo conjunto de indicadores económicos que en el resuelto, se quieren agrupar provincias.


Funciones de R


Bibliografía básica

Aldás, J. y Uriel, E. 2017. Análisis multivariante aplicado en R. Ediciones Paraninfo, Madrid.

Uriel, E. y Aldás, J. 2005. Análisis Multivariante Aplicado. Thomson Editores Spain.


Licencia de Creative Commons
Grupo Innovación Docente: Estadística en Ciencias Sociales. Universidad de Murcia.
Esta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional.