Taula de continguts:
Definició: què significa Extracció?
L’extracció és el procés d’obtenir informació rellevant de fonts de dades en un patró específic per utilitzar-lo en un entorn d’emmagatzematge de dades. L’extracció aporta significat a les dades i és el primer pas del procés de transformació de dades. L’extracció només selecciona determinades dades que s’ajusten a una condició o categoria d’una enorme col·lecció de dades procedents de diverses fonts.
Techopedia explica l'extracció
En un entorn d’emmagatzematge de dades, s’ha de processar, transformar i emmagatzemar una enorme col·lecció de dades procedents de diverses estructures i fonts no estructurades per obtenir conclusions i prediccions significatives. Les dades procedents de les fonts primàries s’han d’importar al sistema d’emmagatzematge de dades de manera sistemàtica que faciliti la realització de les diverses operacions de dades. Aquest procés s’anomena extracció. L'extracció afegeix l'estructura a les dades no estructurades seguint algunes regles. A continuació es mostren algunes de les tècniques emprades en l’extracció de dades:
- Coincidència de patrons
- Enfocament basat en taula
- Analítica de text
