Casa Tendències Quina és una manera senzilla de descriure biaix i variació en l'aprenentatge de màquines?

Quina és una manera senzilla de descriure biaix i variació en l'aprenentatge de màquines?

Anonim

P:

Quina és una manera senzilla de descriure biaix i variació en l'aprenentatge de màquines?

R:

Hi ha diverses maneres complicades de descriure el biaix i la variació en l'aprenentatge automàtic. Molts d'ells utilitzen equacions matemàtiques significativament complexes i mostren mitjançant gràfics com exemples específics representen diverses quantitats tant de biaix com de variància.

A continuació, es mostra una manera senzilla de descriure el biaix, la variància i el bias / variance compromís en l'aprenentatge de màquines.

En el seu nucli, el biaix és una sobreimplificació. Pot ser important afegir a la definició de biaix algun supòsit o error assumit.

Si un resultat altament esbiaixat no hagués equivocat, si es dedica als diners, seria altament precís. El problema és que el model simplificat conté algun error, per la qual cosa no es troba en l'ull de bou: l'error important continua repetint-se o fins i tot amplificat-se a mesura que funciona el programa d'aprenentatge automàtic.

La simple definició de variància és que els resultats són massa dispersos. Això sovint condueix a una sobrecomplexitat del programa i a problemes entre grups de proves i entrenaments.

L’alta variació significa que els petits canvis creen grans canvis en els resultats o resultats.

Una altra manera de descriure simplement la variància és que hi ha massa soroll al model i, per tant, és més difícil que el programa d'aprenentatge de màquines aïli i identifiqui el senyal real.

Per tant, una de les maneres més senzilles de comparar biaix i variació és suggerir que els enginyers d’aprenentatge de màquines han de caminar una línia fina entre massa esbiaixament o sobredimplicació i massa variació o sobrecomplexitat.

Una altra forma de representar aquest pou és amb un gràfic de quatre quadrants que mostra totes les combinacions d’alta i baixa variació. En el quadrant de parcialitat baixa o de baixa variació, tots els resultats es reuneixen en un clúster precís. En un resultat de biaix elevat / de baixa variació, tots els resultats es reuneixen en un clúster imprecis. En un resultat de biaix baix / biaix elevat, els resultats es dispersen en un punt central que representaria un clúster precís, mentre que en un resultat de biaix / alta variació, els punts de dades es troben dispersos i imprecisos.

Quina és una manera senzilla de descriure biaix i variació en l'aprenentatge de màquines?