Taula de continguts:
Definició: què significa K-Means Clustering?
K-means clustering és un simple algorisme d’aprenentatge no supervisat que s’utilitza per resoldre problemes de clustering. Segueix un senzill procediment per classificar un conjunt de dades determinat en un nombre de clústers, definit per la lletra "k", prèviament fixada. Els clústers es posicionen com a punts i totes les observacions o punts de dades s’associen al clúster més proper, es calculen, s’ajusten i aleshores s’inicia el procés fent servir els nous ajustaments fins que s’arriba al resultat desitjat.
K-means clustering té usos en motors de cerca, segmentació de mercat, estadístiques i fins i tot en astronomia.
Techopedia explica K-Means Clustering
El K-means clustering és un mètode utilitzat per a l'anàlisi de clustering, especialment en la mineria de dades i estadístiques. Té com a objectiu dividir un conjunt d’observacions en diversos grups (k), donant com a resultat la partició de les dades en cèl·lules de Voronoi. Es pot considerar un mètode per esbrinar a quin grup pertany realment un determinat objecte.
S'utilitza principalment en estadístiques i es pot aplicar a gairebé qualsevol branca d'estudi. Per exemple, en màrqueting, es pot utilitzar per agrupar diferents dades demogràfiques de persones en grups senzills que facilitin la orientació als venedors. Els astrònoms l'utilitzen per a filtrar grans quantitats de dades astronòmiques; ja que no poden analitzar cada objecte un per un, necessiten una forma de trobar estadísticament punts d’interès per a l’observació i la investigació.
L’algorisme:
- Els punts K es col·loquen a l’espai de dades de l’objecte que representa el grup inicial de centreides.
- Cada objecte o punt de dades s'assigna al k més proper.
- Després d'assignar tots els objectes, es tornen a calcular les posicions dels k centroides.
- Els passos 2 i 3 es repeteixen fins que les posicions dels centreides ja no es mouen.
