P:
Com podria el concepte d'equilibri informar els projectes d'aprenentatge automàtic?
R:En general, un equilibri informarà l’aprenentatge de màquines buscant estabilitzar els entorns d’aprenentatge de màquines i crear resultats amb una barreja compatible de components determinístics i probabilístics.
Els experts descriuen un "equilibri" com una situació en què els actors racionals d'un sistema d'aprenentatge de màquines arriben a un consens sobre l'acció estratègica; en particular, l'equilibri Nash en la teoria de jocs implica dos o més d'aquests actors racionals que consoliden les estratègies en reconèixer que cap jugador beneficia. canviar una estratègia particular si els altres jugadors no canvien la seva.
Descàrrega gratuïta: Aprenentatge automàtic i per què és important |
Una demostració particularment popular i senzilla de l'equilibri de Nash implica una matriu simple on dos jugadors trien cadascun un resultat binari.
L'anterior és una manera força tècnica de descriure l'equilibri i el seu funcionament. Una manera molt més informal d’il·lustrar el concepte d’equilibri, en particular l’exemple anterior de dos actors racionals cadascun amb elecció binària, és pensar en allò que podríeu anomenar el “caminar cap a l’altre pel passadís de la secundària”.
Suposem que dues persones caminen en direccions diferents per un passadís de la secundària (o qualsevol altre tipus de zona), que només té espai per a dues persones amb amplada. Les dues vies obertes són els resultats binaris. Si els dos actors racionals trien resultats binaris diferents que no entren en conflicte entre ells, es passaran els uns als altres i saludaran. Si trien dos resultats binaris en conflicte, caminaran en el mateix espai i un d'ells haurà de cedir.
A l’exemple anterior, si els dos actors racionals trien els dos resultats compatibles i no conflictius, el consens general és que cap dels dos guanya canviant d’estratègia -en aquest cas les seves indicacions de marxa- si l’altra persona no els canvia.
L'anterior constitueix un equilibri que es pot modelar en qualsevol construcció d'aprenentatge automàtic determinat. Tenint en compte aquest simple exemple, els resultats sempre seran els dos actors racionals que cooperaran, és a dir, dues persones que es troben al costat de l’altra.
El contrari es podria anomenar "desequilibri": si els dos actors racionals opten per resultats conflictius, com s'ha esmentat, un d'ells haurà de cedir. Tanmateix, el model de ML que modeli això es podria llençar en un bucle infinit si ambdues decideixen cedir, com dues persones per moure's per intentar acomodar-se les unes a les altres i segueixen caminant cap a la col·lisió.
Equilibris com el de dalt s’utilitzaran generalment en l’aprenentatge automàtic per crear consens i estabilitzar models. Els enginyers i desenvolupadors buscaran els escenaris i situacions que es beneficien d'equilibris i treballaran per canviar o gestionar els que no ho són. Analitzant exemples del món real que corresponen als equilibris de ML, és fàcil veure com aquest tipus d’anàlisi en el sistema d’aprenentatge de màquines és instructiu exclusivament per esbrinar com modelar el comportament humà creant agents i agents racionals. Aquest és només un exemple excel·lent de com es pot utilitzar un equilibri per fer avenços en l’aplicació de sistemes d’aprenentatge automàtic.