Per què disminueix la variació en el sistema d’aprenentatge automàtic?

2025

L’agregació de malla d’arrencada, o “bagging”, en l’aprenentatge automàtic disminueix la variació a través de la creació de models més avançats de conjunts de dades complexos. Concretament, l'enfocament d'embalatge crea subconjunts que sovint es solapen per modelar les dades d'una manera més implicada.

Una de les idees interessants i senzilles sobre com aplicar les maletes és agafar un conjunt de mostres aleatòries i extreure’n la mitjana simple. A continuació, utilitzant el mateix conjunt de mostres, creeu desenes de subconjunts construïts com a arbres de decisió per manipular els resultats eventuals. La segona mitjana hauria de mostrar una imatge més clara de com es relacionen les mostres individuals entre elles en termes de valor. La mateixa idea es pot aplicar a qualsevol propietat de qualsevol conjunt de punts de dades.

Descàrrega gratuïta: Aprenentatge automàtic i per què és important

Atès que aquest enfocament consolida el descobriment en límits més definits, disminueix la variància i ajuda a la concordança. Penseu en un quadre de dispersió amb punts de dades una mica distribuïts; mitjançant un mètode d'embalatge, els enginyers "redueixen" la complexitat i orienten les línies de descobriment cap a paràmetres més suaus.

Alguns parlen del valor de la borsa com "dividir i conquerir" o un tipus de "heurística assistida". La idea és que mitjançant la modelització d’ensemblees, com ara l’ús de boscos aleatoris, aquells que utilitzin l’ensacat com a tècnica puguin obtenir resultats de dades de menor variació. En termes de disminució de la complexitat, la maleta també pot ajudar a la sobrepesca. Penseu en un model amb massa punts de dades: per exemple, un punt de connexió amb 100 punts no alineats. La línia de dades visual resultant serà commutada, dinàmica i volàtil. A continuació, "calmar" la diferència mitjançant la creació de conjunts d'avaluacions. En l'aprenentatge de grups, sovint es pensa que s'uneix a diversos "aprenents febles" per proporcionar un resultat col·laboratiu "d'aprenentatge fort". El resultat és una línia de dades més suau i més contornejada i una menor variació salvatge en el model.

És fàcil veure com es pot aplicar la idea d’embalatge als sistemes informàtics empresarials. Els líders empresarials solen voler que "els ulls dels ocells" visquin el que passa amb productes, clients, etc. Un model no equipat pot retornar dades menys digeribles i resultats més "dispersos", on la maleta pot "estabilitzar" un model i fer-lo més útil als usuaris finals.