P:
Per què és tan important la selecció de funcions en l’aprenentatge automàtic?
R:La selecció de funcions és extremadament important en l'aprenentatge automàtic principalment perquè serveix com a tècnica fonamental per dirigir l'ús de les variables cap a allò més eficaç i eficaç per a un determinat sistema d'aprenentatge de màquines.
Els experts parlen de com funcionen la selecció de funcions i l’extracció de funcions per minimitzar la maledicció de la dimensionalitat o ajudar a afrontar l’abonament adequat: es tracta de maneres diferents d’abordar la idea d’un modelatge excessivament complex.
Descàrrega gratuïta: Aprenentatge automàtic i per què és important |
Una altra manera de dir-ho és que la selecció de funcions ajuda a oferir als desenvolupadors les eines per utilitzar només les dades més rellevants i útils en conjunts d’entrenament d’aprenentatge automàtic, cosa que redueix dràsticament els costos i el volum de dades.
Un exemple és la idea de mesurar una forma complexa a escala. A mesura que el programa s’escala, identifica un nombre més gran de punts de dades i el sistema es torna molt més complex. Però una forma complexa no és el conjunt de dades típic que utilitza un sistema d'aprenentatge automàtic. Aquests sistemes poden utilitzar conjunts de dades que tenen uns nivells de variació molt diferents entre diferents variables. Per exemple, en classificar espècies, els enginyers poden utilitzar la selecció de funcions per estudiar només les variables que els donaran els resultats més objectius. Si cada animal del gràfic té el mateix nombre d’ulls o cames, es podran extreure aquestes dades o es poden extreure altres punts de dades més rellevants.
La selecció de funcions és el procés discriminatori mitjançant el qual els enginyers dirigeixen els sistemes d'aprenentatge de màquines cap a un objectiu. A més de la idea d’eliminar la complexitat dels sistemes a escala, la selecció de funcions també pot ser útil per optimitzar aspectes d’allò que els experts anomenen el “compromís de variació de biaix” en l’aprenentatge de màquines.
Les raons per les quals la selecció de funcions ajuda a l'anàlisi del biaix i la variància són més complicades. Un estudi de la Universitat de Cornell sobre la selecció d’equips, la variació de biaix i l’ensacat serveix per il·lustrar com es projecten els ajuts a la selecció de funcions.
Segons els autors, el document "examina el mecanisme mitjançant el qual la selecció de funcions millora la precisió de l'aprenentatge supervisat".
L'estudi afirma a més:
Una anàlisi empírica de biaix / variància a mesura que avança la selecció de funcions indica que el conjunt de funcions més precís correspon al millor punt de diferenciació de biaix de variància de l'algoritme d'aprenentatge.
Quan es discuteix l'ús d'una rellevància forta o feble, els escriptors parlen de la selecció de funcions com "un mètode de reducció de la variància", això té sentit quan es pensa en la variació com a essencialment la quantitat de variació en una determinada variable. Si no hi ha diferència, el punt o matriu de dades poden ser essencialment inútils. Si hi ha una diferència extremadament elevada, pot implicar-se en allò que els enginyers poden pensar en "soroll" o en resultats irrelevants, arbitraris, difícils de gestionar per al sistema d'aprenentatge de màquines.
A la vista d’això, la selecció de funcions és una part fonamental del disseny en l’aprenentatge automàtic.