Taula de continguts:
Definició: què significa Dades sense etiquetar?
Les dades sense etiquetes són una designació de peces que no han estat etiquetades amb etiquetes que identifiquen característiques, propietats o classificacions. Les dades sense etiquetatge s'utilitzen normalment en diverses formes d'aprenentatge automàtic.
Techopedia explica les dades sense etiquetes
En els tipus d'aprenentatge automàtic anomenats aprenentatge automàtic no supervisat, el programa d'aprenentatge automàtic funciona avaluant conjunts de dades sense etiqueta. Com que les dades no tenen etiquetes, el programa d’aprenentatge automàtic ha d’identificar cada peça de dades sobre les seves propietats i característiques.
Una de les millors maneres d’explicar-ho és utilitzant la metàfora del bol de fruita. Suposem que el programa d’aprenentatge automàtic està aprenent a identificar tres tipus diferents de fruites: plàtans, raïm i pomes. Si les dades del conjunt d'entrenament inicial s'etiqueten, el programa d'aprenentatge automàtic funciona des d'aquesta perspectiva: coincideix imatges successives a una d'aquestes tres categories.
Si, però, cap de les dades no s’etiqueta amb els tres noms de fruites (plàtans, raïm i pomes), el programa d’aprenentatge automàtic haurà de funcionar avaluant cada imatge i mirant característiques com les formes del color groc, vermell o morat -. llargs i prims, rodons o agrupats, i altres característiques.
A partir d’aquest exemple, és fàcil veure com les dades etiquetades ofereixen oportunitats molt més fàcils d’utilitzar algoritmes d’aprenentatge automàtic per obtenir resultats de decisió. No obstant això, sofisticats programes d'aprenentatge automàtic no supervisats que tracten dades sense etiquetes poden produir també resultats sorprenentment precisos i precisos.