P:
Quins són els quatre fonaments per convertir-se en un bon científic de dades?
R:Com molts experts assenyalen, convertir-se en un gran científic en dades requereix una combinació d’habilitats i experiència que es construeix mitjançant l’aprenentatge i l’anàlisi dedicats d’un camp complex. Els científics de dades com a administradors i els curadors d’actius de dades valuoses tenen molta demanda avui dia. Mirem en què consisteixen algunes d’aquestes habilitats fundacionals.
El primer dels quatre components fonamentals del treball de científic de dades són les matemàtiques i les estadístiques. Els bons científics de dades han d’aprendre a conversar en diversos conceptes matemàtics relacionats amb l’aprenentatge automàtic supervisat i no supervisat, inclosos tipus d’algoritmes com ara arbres de decisió, bosc aleatori, regressió logística, agrupació i l’ús de la dimensionalitat en l’aprenentatge de màquines (ML). En general, han de tenir un bon maneig de treballar amb equacions i estadístiques matemàtiques mitjançant recursos d’anàlisi estadística.
El segon component fonamental del treball en ciències de dades consisteix en la programació i la gestió de bases de dades. Els individus haurien de ser forts en llenguatges de script com Python i llenguatges estadístics com R, juntament amb experiència i habilitat amb bases de dades i semàntiques SQL i tècniques operatives. El coneixement de components de programari com Hadoop, MapReduce, Hive i Pig també resulta atractiu per als empresaris.
El tercer component fonamental per convertir-se en un bon científic de dades és el component teòric i filosòfic de la comprensió de la ciència de dades i l’aprenentatge automàtic. Aquests individus haurien de solucionar problemes autònoms amb ments curioses, al cap i a la fi estan combinant anàlisis quantitatives primeres amb la comprensió creativa dels processos d'aprenentatge de màquines i de ciències de dades. En lloc de ser persones de nombres tècnics, haurien de tenir una profunda base en el que significa crear projectes d'aprenentatge automàtic i treballar en iniciatives de ciències de dades en termes d'objectius i resultats finals.
Un quart pilar important d’aprendre a ser un bon científic científic consisteix en treballar amb les persones i poder utilitzar dades de manera que tingui sentit per a altres persones.
Els bons científics de dades poden ser narradors: poden traduir dades quantitatives en narracions i informació. Com a tal, haurien de tenir bones habilitats comunicatives per poder posar els seus treballs a la taula i difondre-la entre diversos grups d'interès o un públic determinat de manera efectiva. Aquests són alguns dels principals tipus d’habilitats que construeixen un bon científic de dades que està disposat a participar en la indústria informàtica d’avançament ràpid i d’avanç actual.