Agrupamiento Basado en Modelos
Un Agrupamiento Basado en Modelos (MBC, por sus siglas en inglés) es un enfoque en el aprendizaje automático no supervisado donde los puntos de datos se agrupan en clústeres basándose en un modelo probabilístico en lugar de métricas puramente basadas en distancia. En lugar de simplemente encontrar los vecinos más cercanos, los MBCs asumen que los datos fueron generados a partir de una mezcla de distribuciones de probabilidad subyacentes, donde cada distribución representa un clúster distinto.
Para la inteligencia de negocios, los MBCs ofrecen una forma estadísticamente rigurosa de segmentar conjuntos de datos complejos. A diferencia de los métodos de agrupamiento simples que pueden crear límites arbitrarios, los MBCs proporcionan un marco probabilístico, lo que permite a los analistas cuantificar la probabilidad de que un punto de datos pertenezca a un grupo específico. Esto conduce a conocimientos empresariales más sólidos y defendibles.
La implementación más común de MBC son los Modelos de Mezcla Gaussiana (GMMs). Los GMMs asumen que los puntos de datos se extraen de una mezcla de varias distribuciones gaussianas. El algoritmo estima iterativamente los parámetros (media, covarianza y pesos de mezcla) de estas distribuciones. Luego, cada punto de datos se asigna al clúster cuya distribución tiene la mayor probabilidad de generar ese punto. El modelo aprende la estructura subyacente de los datos, en lugar de solo la proximidad de los puntos.
El Agrupamiento Basado en Modelos es muy valioso en varios dominios: