Taula de continguts:
Definició: què significa Hadoop Ecosystem?
L’ecosistema Hadoop fa referència als diversos components de la biblioteca de programari Apache Hadoop, així com als accessoris i eines que proporciona la Apache Software Foundation per a aquest tipus de projectes de programari i a les maneres de treballar conjuntament.
Hadoop és un marc basat en Java que és extremadament popular per manejar i analitzar grans conjunts de dades.
Techopedia explica Hadoop Ecosystem
Tant el nucli principal Hadoop com els seus accessoris són principalment projectes de codi obert amb llicència d'Apache. La idea d’un ecosistema Hadoop consisteix en l’ús de diferents parts del conjunt principal d’Hadoop com MapReduce, un marc per a la manipulació de grans quantitats de dades, i el Sistema de fitxers distribuïts Hadoop (HDFS), un sofisticat sistema de maneig de fitxers. També hi ha YARN, un gestor de recursos Hadoop.
A més d’aquests elements bàsics d’Hadoop, Apache també ha subministrat altres tipus d’accessoris o eines complementàries per a desenvolupadors. Aquests inclouen Apache Hive, una eina d’anàlisi de dades; Apache Spark, un motor general per processar big data; Apache Pig, un llenguatge de flux de dades; HBase, una eina de bases de dades; i també Ambarl, que es pot considerar com a gestor d’ecosistemes Hadoop, ja que ajuda a administrar l’ús d’aquests diversos recursos Apache. Quan Hadoop es converteix en l’estàndard de facto per a la recollida de dades i es converteix en omnipresent en moltes organitzacions, els gestors i els líders de desenvolupament estan aprenent tot sobre l’ecosistema Hadoop i quins tipus de coses participen en una configuració general d’Hadoop.