Com poden els enginyers avaluar els conjunts d'entrenament i els conjunts de proves per detectar una possible adequació en l'aprenentatge de màquines?

2026

Per entendre com es fa això és necessari conèixer bàsicament els rols dels diferents conjunts de dades en un projecte típic d'aprenentatge de màquines. El conjunt de formació està configurat per donar a la tecnologia un marc de referència: una línia de referència de dades que el programa utilitza per prendre decisions prediccionals i probabilístiques. El conjunt de proves és el lloc en què es prova la informació de la màquina.

L’abonament és un síndrome de l’aprenentatge automàtic on el model no s’ajusta totalment a les dades ni a la finalitat.

Descàrrega gratuïta: Aprenentatge automàtic i per què és important

Un dels comandaments generals de l'aprenentatge automàtic és que les dades de formació i les proves de prova han de ser conjunts de dades separats. Hi ha un consens bastant ampli sobre això, almenys en moltes aplicacions, a causa d’alguns problemes concrets amb l’ús del mateix conjunt que vau utilitzar per a l’entrenament per provar un programa d’aprenentatge automàtic.

Quan un programa d’aprenentatge automàtic utilitza un conjunt d’entrenament, que es podria anomenar essencialment un conjunt d’inputs, s’elabora aquest conjunt d’entrenament per prendre decisions sobre resultats predictius. Una manera molt bàsica de pensar-hi és que el conjunt d’entrenaments és el “menjar” per al procés d’informàtica intel·lectual.

Ara, quan aquest mateix conjunt s’utilitza per fer proves, la màquina sovint pot obtenir resultats excel·lents. Això és perquè ja havia vist aquestes dades abans. Però l'objectiu de l'aprenentatge automàtic en molts casos és fer resultats sobre dades que no s'han vist abans. Els programes d'aprenentatge automàtic de propòsit general es realitzen per operar sobre diversos conjunts de dades. Dit d'una altra manera, el principi de l'aprenentatge automàtic és el descobriment, i no solen obtenir-ne tantes coses a través d'un entrenament inicial per a proves.

A l’hora d’avaluar els conjunts d’entrenament i els conjunts de proves per a una possible adaptació, els enginyers podrien avaluar els resultats i esbrinar per què un programa pot fer-ho de manera diferent en els resultats comparatius d’aquests dos conjunts, o en alguns casos com la màquina pot fer massa bé amb les dades de formació mateix. .

En una descripció capaç d'alguns d'aquests problemes en l'aprenentatge de màquines en una obra del 2014, Jason Brownlee, a Machine Learning Mastery, descriu l'adequació d'aquesta manera:

"És probable que un model seleccionat per la seva exactitud al conjunt de dades d'entrenament en lloc de la seva precisió en un conjunt de dades de proves no vistes tinguin una precisió inferior a un conjunt de dades de proves no vistes", escriu Brownlee. "El motiu és que el model no està tan generalitzat. S'ha especialitzat en l'estructura del conjunt de dades de formació (afegida en cursiva). A això s'anomena excés, i és més insidiós del que creieu."

En termes laics, podríeu dir que en especialitzar-vos en el conjunt de dades de formació, el programa s'està tornant massa rígid. Aquesta és una altra forma metafòrica de mirar per què un programa d’aprenentatge automàtic no es proporciona de manera òptima mitjançant l’ensenyament establert per al conjunt de proves. També és una bona manera d’aproximar a avaluar aquests dos conjunts diferents, ja que els resultats mostraran molt als enginyers sobre el funcionament del programa. Voleu un petit desfasament entre precisió dels dos models. Voleu assegurar-vos que el sistema no està sobredimensionat o "fusionat amb precisió" en un conjunt de dades concret, però això és més general i és capaç de créixer i evolucionar al comandament.