P:
Quina diferència hi ha entre aprenentatge automàtic i mineria de dades?
R:La mineria de dades i l’aprenentatge automàtic són dos termes molt diferents, però sovint s’utilitzen en un mateix context, la qual cosa és la capacitat de les parts per perfeccionar i ordenar dades per obtenir informació i conclusions. Les similituds i les diferències combinades poden fer que es parli d’aquests dos processos molt diferents, confusos per a audiències menys tecnològiques.
La mineria de dades és el procés d’agregar dades i després extreure dades útils d’aquest conjunt de dades més gran. És un tipus de descobriment de coneixement que s’està succeint des de que vam arribar a ser capaços d’agregar grans quantitats de dades. Podeu fer una mineria de dades amb un sistema bastant primitiu: el programa estarà programat per cercar patrons i tendències de dades específiques, i la informació tècnica serà “extirpada” a partir de la massa bruta de dades en qualsevol forma que sigui.
L’aprenentatge automàtic és quelcom més nou i sofisticat. L’aprenentatge automàtic fa servir conjunts de dades, però a diferència de la mineria de dades, l’aprenentatge automàtic utilitza algoritmes i configuracions elaborades com ara xarxes neuronals per permetre que la màquina aprengui de les dades d’entrada. Com a tal, l'aprenentatge de màquines és una mica més en profunditat que una operació de mineria de dades. Per exemple, en una xarxa neuronal, les neurones artificials treballen en capes per agafar dades d’entrada i alliberar dades de sortida amb molta activitat elaborada de “caixa negra” entremig (el terme “caixa negra” s’aplica a sistemes més sofisticats quan els humans tenen una és difícil entendre com les xarxes neuronals o els algoritmes realitzen la seva tasca).
La mineria de dades i l'aprenentatge de màquines també són molt diferents en les seves aplicacions a l'empresa. Una altra vegada, l'explotació de dades pot continuar dins de qualsevol aplicació ERP determinada i en molts processos diversos.
Per contra, un projecte d'aprenentatge automàtic requereix recursos considerables. Els gestors de projectes han de reunir les dades de formació i de prova, buscar problemes com l'adequació, decidir la selecció de funcions i l'extracció de funcions, i molt més. L’aprenentatge automàtic pot requerir formes complexes de compra de diverses parts interessades, mentre que les activitats d’explotació de dades solen només necessitar un registre ràpid.
Malgrat aquestes diferències, tant la mineria de dades com l’aprenentatge automàtic s’apliquen a l’àmbit de la ciència de dades. L’aprenentatge més sobre la ciència de dades ajuda els interessats a obtenir més informació sobre com funcionen aquests processos i sobre com es poden aplicar en qualsevol indústria determinada.