Casa Bases de dades Què és el sistema d’arxius distribuït d’Hoop (hdfs)? - Definició de tecnologia

Què és el sistema d’arxius distribuït d’Hoop (hdfs)? - Definició de tecnologia

Taula de continguts:

Anonim

Definició: què significa el sistema de fitxers distribuït (HDFS) de Hadoop?

El Sistema de fitxers distribuïts Hadoop (HDFS) és un sistema de fitxers distribuït que funciona amb maquinari estàndard o de gamma baixa. Desenvolupat per Apache Hadoop, HDFS funciona com un sistema de fitxers distribuït estàndard, però proporciona un millor rendiment i accés de dades a través de l'algoritme MapReduce, alta tolerància a les errades i suport natiu de grans conjunts de dades.

Techopedia explica el sistema de fitxers distribuït Hadoop (HDFS)

L'HDFS emmagatzema una gran quantitat de dades col·locades en diverses màquines, normalment en centenars i milers de nodes connectats simultàniament, i proporciona fiabilitat de dades replicant cada instància de dades com tres còpies diferents, dues en un grup i una en un altre. Aquestes còpies es podran substituir en cas d’error.

L’arquitectura HDFS consta de clústers, a tots els quals s’accedeix a través d’una única eina de programari NameNode instal·lada en una màquina separada per controlar i gestionar el sistema d’arxius i el mecanisme d’accés dels usuaris del clúster. Les altres màquines instal·len una instància de DataNode per gestionar l’emmagatzematge de clúster.

Com que HDFS està escrit en Java, té suport natiu per a interfícies de programació d'aplicacions Java (API) per a la integració i l'accessibilitat d'aplicacions. També es pot accedir a través de navegadors web estàndard.

Què és el sistema d’arxius distribuït d’Hoop (hdfs)? - Definició de tecnologia