Casa Àudio Com puc aprendre a utilitzar hadoop per analitzar dades grans?

Com puc aprendre a utilitzar hadoop per analitzar dades grans?

Anonim

P:

Com puc aprendre a utilitzar Hadoop per analitzar dades grans?

R:

El conjunt de programari Apache conegut com Hadoop s'està convertint en un recurs molt popular per tractar conjunts de dades grans. Aquest tipus de programari de maneig de dades es va crear per ajudar a agregar dades de maneres específiques, basades en dissenys que poden fer més eficients alguns tipus de projectes de dades. Dit això, Hadoop és només una de les moltes eines per gestionar grans conjunts de dades.

Una de les primeres formes més bàsiques d’aprendre sobre l’anàlisi de dades grans amb Hadoop és comprendre alguns dels components de primer nivell d’Hadoop i què fa. Aquests inclouen una "plataforma de gestió de recursos" de Hadoop que es pot aplicar a determinats tipus de configuracions de xarxa, així com un conjunt de funcions Hadoop MapReduce que s'apliquen als conjunts de dades grans. També hi ha un sistema de fitxers distribuït Hadoop (HDFS), que ajuda a emmagatzemar dades a través de sistemes distribuïts de manera que puguin ser indexats o recuperats de manera ràpida i eficaç.

Més enllà d’això, aquells que vulguin familiaritzar-se amb Hadoop poden consultar recursos publicats individuals per a professionals que expliquen el programari a nivell relatiu. Aquest exemple de Chris Stucchio en un bloc personal proporciona un conjunt excel·lent de punts sobre Hadoop i escala de dades. Una de les opcions bàsiques per a emportar-se és que Hadoop pot ser més utilitzat del que és necessari i pot no ser la millor solució per a un projecte individual. La revisió d'aquest tipus de recursos ajudarà els professionals a familiaritzar-se amb els detalls de l'ús d'Hadoop en qualsevol escenari. Stucchio també proporciona metàfores per relacionar les funcions d'Hadoop amb tasques físiques específiques. Aquí, l'exemple és comptar el nombre de llibres d'una biblioteca, mentre que una funció Hadoop podria dividir aquesta biblioteca en seccions, proporcionant recomptes individuals que es barregen en un resultat de dades agregades.

Una forma més detallada de què els professionals puguin aprendre més sobre Hadoop i la seva aplicació a big data és mitjançant recursos i programes de formació específics. Per exemple, l’empresa d’aprenentatge en línia Cloudera, un prestigiós proveïdor de sessions de formació a distància, ofereix diverses opcions interessants sobre l’ús d’Hadoop i altres tipus similars de maneig de dades.

Com puc aprendre a utilitzar hadoop per analitzar dades grans?