P:
Per què és important que els científics busquin transparències de dades?
R:La transparència és essencialment important en els projectes de ciències de dades i programes d’aprenentatge automàtic, en part per la complexitat i sofisticació que els impulsa, perquè aquests programes “estan aprenent” (generant resultats probabilístics) en lloc de seguir instruccions de programació lineal predeterminades, i perquè, com a resultat, pot ser difícil entendre com la tecnologia arriba a conclusions. En aquest camp, el problema de la "caixa negra" dels algorismes d'aprenentatge de màquines que no poden ser completament explicables per als que decideixen ésser humà.
Tenint això en compte, poder dominar l'aprenentatge automàtic explicable o la "IA explicable" serà un focus principal en la forma en què les empreses busquen l'adquisició de talent per a un científic de dades. DARPA, la institució que ens ha portat internet, finança un estudi multimilionari en IA explicable, intentant promoure les habilitats i recursos necessaris per crear tecnologies d’aprenentatge automàtic i intel·ligència artificial transparents per als humans.
Una forma de pensar-hi és que sovint hi ha una “etapa d’alfabetització” del desenvolupament del talent i una “etapa d’hiperliteraritat”. Per a un científic de dades, l’etapa tradicional d’alfabetització seria el coneixement de com es poden crear programes d’aprenentatge automàtic i com es pot construir. algoritmes amb idiomes com Python; com construir xarxes neuronals i treballar amb elles. L’etapa d’hiperliteraritat seria la capacitat de dominar la IA explicable, de proporcionar transparència en l’ús d’algoritmes d’aprenentatge automàtic i de preservar la transparència a mesura que aquests programes funcionen cap als seus objectius i els objectius dels seus gestors.
Una altra manera d’explicar la importància de la transparència en la ciència de dades és que els conjunts de dades que s’utilitzen continuen sent més sofisticats i, per tant, més intrusius en la vida de les persones. Un altre dels principals motors de l’aprenentatge automàtic explicable i la ciència de dades és el Reglament general de protecció de dades europeu que s’ha implementat recentment per intentar frenar l’ús poc ètic de dades personals. Utilitzant el GDPR com a cas de prova, els experts poden veure com la necessitat d’explicar els projectes de ciències de dades s’ajusta a les preocupacions de privacitat i seguretat, així com l’ètica empresarial.