Casa Desenvolupament Què és un procés de decisió de Markov (mdp)? - Definició de tecnologia

Què és un procés de decisió de Markov (mdp)? - Definició de tecnologia

Taula de continguts:

Anonim

Definició: què significa el procés de decisió de Markov?

Un procés de decisió de Markov (MDP) és una cosa que els professionals anomenen un "procés de control estocàstic de temps discret". Es basa en matemàtiques pionera per l'acadèmic rus Andrey Markov a finals del segle XIX i principis del XX.

Techopedia explica el procés de decisió de Markov (MDP)

Una forma d’explicar un procés de decisió de Markov i les cadenes associades de Markov és que es tracta d’elements de la teoria de jocs moderns basats en investigacions matemàtiques més senzilles pel científic rus fa uns cent anys. La descripció d’un procés de decisió de Markov és que estudia un escenari en què un sistema es troba en algun conjunt d’estats donat i avança cap a un altre estat basat en les decisions d’un responsable de decisió.

Una cadena Markov com a model mostra una seqüència d'esdeveniments en què la probabilitat d'un esdeveniment determinat depèn d'un estat assolit anteriorment. Els professionals poden parlar d’un “espai d’estat comptable” a l’hora de descriure el procés de decisió de Markov: alguns associen la idea del model de decisió de Markov amb un model de “caminada a l’atzar” o un altre model d’estocàstic basat en probabilitats (el model de caminada aleatòria, sovint citat a Wall. Street, modelitza el moviment d’un capital amunt o avall en un context de probabilitat del mercat).

En general, els processos de decisió de Markov s’apliquen sovint a algunes de les tecnologies més sofisticades que els professionals treballen actualment, per exemple, en la robòtica, l’automatització i els models de recerca.

Què és un procés de decisió de Markov (mdp)? - Definició de tecnologia