Taula de continguts:
Definició: què significa la cadena de treballs?
L'encadenament de treballs és un terme de MapReduce que es refereix a llançar diversos passos en la mateixa tasca MapReduce. Un cop encadenat el treball, el primer treball envia la sortida a un treball, que envia la sortida al següent treball de la cadena, etc. fins que la feina s'hagi completat. És una forma de canalitzar treballs MapReduce per fer-los més manejables.
Techopedia explica Job Chaining
La cadena de treball a MapReduce es refereix a executar diverses tasques en un sol treball MapReduce.
Per exemple, una cadena de treball pot consistir en:
Map1> Reduir1> Map2> Reduir2
L’avantatge de l’encadenament laboral és que elimina la necessitat de dades intermèdies entre tots els passos d’una canalització. En aquest sentit, la cadena de treball és similar a la redirecció d'entrada / sortida del shell Unix. La sortida d'un enllaç a la cadena flueix a l'entrada del següent treball de la cadena. MapReduce permet als desenvolupadors especificar dependències o quines tasques s’han de completar abans de processar els propers treballs de la cadena mitjançant l’ús de la trucada al mètode addDependingJob ().
Això fa que un desenvolupador escrigui un programa MapReduce que pugui processar grans quantitats de dades.
