P:
Per què és útil la visualització de dades per a algorismes d’aprenentatge automàtic?
R:La disciplina de visualització de dades ens ofereix pràcticament infinites maneres de mostrar el que passa amb els algorismes d’aprenentatge automàtic. Val la pena pensar exactament per què és tan important la visualització de dades i per què allibera tant de poder creatiu per a tantes persones que s’involucren en processos d’aprenentatge automàtic.
Per entendre el valor de la visualització de dades per a l'aprenentatge automàtic, només cal fer una ullada a qualsevol dels algoritmes que s'utilitzen per crear aquests innovadors programes innovadors.
Un dels més senzills és l’arbre de decisions. Sense entrar en funcions d'activació ni en capes ocultes ni en res, l'arbre de decisions és simplement conjunts de nodes binaris. Però, fins i tot, el simple arbre de decisions és molt difícil per a la gent per descriure-ne o per escriure. És molt més fàcil quan es visualitza en una pantalla o en una pàgina. Quan veieu cada node i les seves connexions amb altres nodes, tot és evident.
Prenguem ara un dels tipus d'algorismes d'aprenentatge automàtic més bizantins i elaborats: la xarxa neuronal.
D’alguna manera, les xarxes neuronals són realment col·leccions d’algoritmes d’aprenentatge de màquines. La configuració bàsica consisteix en una capa d’entrada, capes ocultes i una capa de sortida. Les funcions d’activació ajuden a les neurones digitals individuals a processar inputs ponderats.
Tots aquests ítems i tots aquests processos s’expliquen molt més fàcilment mitjançant la visualització de dades que no pas mitjançant descripcions verbals o escrites. Podeu dir que una xarxa neuronal té unes entrades ponderades que flueixen cap a una capa d’entrada i que s’uneixen en alguna capa oculta i es consoliden en una sortida determinada, però quan utilitzeu una figura visual per mostrar com funciona, l’ull humà i l’humà el cervell en un aspecte molt més directe i útil.
En certa manera, es pot veure la potència de la visualització de dades fins i tot sense tenir en compte l'aprenentatge automàtic. En temps de programació lineal, els compiladors i els estudis de llenguatge informàtic permetrien als programadors triar un programa de prova pas a pas on poguessin inspeccionar els valors de les variables en petites caixes visuals. Un cop més, això va ajudar a mostrar el que passa en una execució molt millor que la lectura mitjançant una base de codis.
L’aprenentatge automàtic és programació hiperintensiva: és programació probabilística i és per això que la visualització de dades realment ens ajuda a posar-nos al cap sobre el que passa amb qualsevol algorisme o procés determinat.