Taula de continguts:
Definició: què significa caracterització?
La caracterització és una metodologia de grans dades que s’utilitza per generar paràmetres descriptius que descriuen eficaçment les característiques i el comportament d’un determinat ítem. A continuació, s'utilitza en algorismes d'aprenentatge no supervisats per trobar patrons, clústers i tendències sense incorporar etiquetes de classe que puguin tenir biaix. Té els seus usos en l'anàlisi de clústers i fins i tot en l'aprenentatge profund.
La Techopedia explica la caracterització
La caracterització de dades grans és una tècnica per transformar les dades en brut en informació útil, utilitzant-se en algorismes d’aprenentatge automàtic i mineria de dades. La caracterització genera essencialment representacions condensades de qualsevol contingut d'informació ocult a les dades. Per tant, es pot utilitzar com a mitjà de mesura i seguiment d'esdeveniments, canvis i nous comportaments emergents en grans fluxos de dades dinàmiques.
Alguns avantatges de la caracterització:
- Pot generar mètriques útils per al seguiment i la mesura d’esdeveniments i anomalies en conjunts de dades
- Crea representacions d'empremta petita amb informació essencial
- Realitza ràpidament la conversió de dades a informació, cosa que apropa la indústria a la transformació completa de dades a informació i coneixement
- És útil per indexar i etiquetar objectes, esdeveniments i altres funcions específiques d’una col·lecció de dades