Casa Tendències Com es poden escalar els entorns de magatzem de dades existents per satisfer les necessitats de les analítiques de grans dades?

Com es poden escalar els entorns de magatzem de dades existents per satisfer les necessitats de les analítiques de grans dades?

Anonim

P:

Com es poden escalar els entorns de magatzem de dades existents per satisfer les necessitats de les analítiques de grans dades?

R:

Els projectes de magatzem de dades individuals han de valorar-se cas per cas. Generalment, per intentar estendre un disseny de magatzem de dades existent per gestionar millor les analítiques de dades grans, hi ha un procés bàsic per esbrinar què cal fer. Els professionals de les TI poden anomenar-ho a "escalar" o "augmentar la mida".

Webinar: Big Iron, Meet Big Data: Liberació de dades de mainframe amb Hadoop i Spark

Registra't aquí

Ampliar generalment consisteix a buscar poder de processament suficient, obtenir una quantitat de memòria suficient i acomodar activitats del servidor més potents per gestionar tots els conjunts de dades més grans que el negoci processarà. Per contra, reduir-se pot suposar recopilar agrupaments de maquinari del servidor i connectar-los junts per corregir grans dades.

Alguns experts informàtics han suggerit que el mètode més comú amb Apache Hadoop i altres eines i plataformes populars de dades grans és ampliar i fer el cluster de maquinari per aconseguir els efectes desitjats. Tanmateix, altres assenyalen que amb la tecnologia actual, un magatzem de dades pot augmentar-se mitjançant una estratègia de contractació que afegeix recursos a un servidor, com ara obtenir un nombre més elevat de nuclis de processament juntament amb una quantitat més gran de memòria RAM.

Tant si s’amplien com s’amplien, els magatzems de dades necessiten actius físics addicionals per poder gestionar la càrrega de treball de dades més gran. També necessiten administració humana addicional, cosa que significa més formació per als equips interns. Cal plantejar-se molt en el projecte per determinar quin tipus d’estrès i la pressió de les càrregues de treball de dades més grans sobre un sistema existent existent per tal d’adaptar-lo a un nou ecosistema de big data. Un dels grans problemes són els colls d'ampolla d'emmagatzematge, que requereixen actualitzacions als centres d'emmagatzematge i altres tipus de colls d'ampolla de rendiment que poden augmentar un sistema naixent si no s'hi aborden.

Com es poden escalar els entorns de magatzem de dades existents per satisfer les necessitats de les analítiques de grans dades?