Taula de continguts:
El volum de grans dades va augmentant de manera creixent dia a dia. A partir de 2.500 exabytes el 2012, es preveu que les grans dades augmentin fins als 40.000 exabytes el 2020. Per tant, l’emmagatzematge de dades és un repte greu que només la infraestructura del núvol és capaç de manejar. El núvol s’ha convertit en una opció popular principalment per la seva enorme capacitat d’emmagatzematge i els seus termes i condicions d’ús que no imposen cap obligació per al subscriptor. L’emmagatzematge al núvol es pot oferir en forma de subscripcions i serveis duren un període predeterminat. Després d'això, no hi ha cap obligació per part del client de renovar-lo.
Tanmateix, emmagatzemar dades grans al núvol obre nous reptes de seguretat que no poden afrontar les mesures de seguretat adoptades per a dades estàtiques regulars. Tot i que les dades grans no són un concepte nou, la seva col·lecció i ús només han començat a augmentar el ritme en els darrers anys. En el passat, l’anàlisi i l’anàlisi de grans dades només es limitaven a les grans corporacions i al govern que podien permetre’s la infraestructura necessària per a l’emmagatzematge i la mineria de dades. Aquesta infraestructura era propietària i no estava exposada a xarxes generals. Tanmateix, les dades grans ja estan disponibles a bon preu per a tot tipus d'empreses a través de la infraestructura del núvol pública. Com a resultat, han sorgit noves amenaces de seguretat sofisticades i continuen multiplicant-se i evolucionant.
Problemes de seguretat en marcs de programació distribuïda
Els marcs de programació distribuïts processen grans dades amb tècniques de càlcul i emmagatzematge paral·leles. En aquests marcs, mapadors no certificats o modificats, que divideixen tasques enormes en sub-tasques més petites de manera que es poden agrupar les tasques per crear una sortida final, poden comprometre les dades. Els nodes de treballadors defectuosos o modificats –que prenen entrades del mapper per executar les tasques– poden comprometre les dades tocant la comunicació de dades entre el mapper i altres nodes de treballador. Els nodes treballadors Rogue també poden crear còpies de nodes legítims del treballador. El fet que sigui extremadament difícil identificar mappers o nodes malaurats en un marc tan gran fa que la seguretat de les dades sigui encara més difícil.