P:
Per què els administradors haurien de vetllar per la redundància de bases de dades?
R:Els gestors de bases de dades i altres professionals de les TI haurien de protegir-se de la "redundància de bases de dades" o la "redundància de dades" a causa de tots els impactes negatius que pot tenir la redundància en un sistema o entorn de bases de dades. Sempre que es dupliqui una determinada dada, ja sigui en dos camps d'una base de dades, o en dos entorns de bases de dades diferents, pot tenir conseqüències per a la recuperació de dades.
Un dels primers motius per evitar la redundància de dades és que pot resultar desperdiciable o excessiu.
És important assenyalar que es preveu alguns tipus de redundància de dades per tal de salvaguardar i fer còpies de seguretat de les dades. Tanmateix, d’altres es produeixen per codificació deficient o ineficient, o per la falta d’atenció a les bones pràctiques. En molts casos, grans quantitats de redundància de dades fan que la base de dades creixi ràpidament més enllà d’una mida raonable. Tenint això en compte, es fan molts esforços per combatre la redundància de dades per estalviar espai a una base de dades i, per tant, per reduir els costos i l’esforç de manteniment. Tot i això, cal fer-ho amb atenció cap a la pràctica: els enginyers poden practicar una cosa que s’anomena deduplicació de dades, però s’ha de fer d’una manera eficient.
Per exemple, els gestors de bases de dades poden explorar alguna cosa com ara retirar una cadena d’un camp repetit, com ara un nom compartit de client o empresa, i substituir-lo per una simple referència variable on la cadena es troba en un altre lloc. Això pot estalviar espai en una base de dades, però també pot requerir més activitat del servidor per realitzar una consulta determinada, de manera que pot no ser tan eficient com sembla.
Una altra gran raó per deduplicar dades o evitar la redundància de dades és a causa de la confusió que es pot produir. Les dades redundants en una base de dades poden causar diversos tipus d’anomalies. Una d’aquestes s’anomena anomalia d’actualització: les anomalies d’actualització es produeixen quan es torna a introduir un registre amb informació actualitzada, però l’actualització no es torna al registre original. En una situació així, pot haver-hi tres registres diferents per a un empleat d'una empresa en concret, amb tres títols de treballs diferents i tres adreces diferents, perquè la informació de la persona no es va actualitzar a tota la base de dades, sinó només al registre que hi va entrar per última vegada.
Tal com suggereixen els experts, els administradors de bases de dades poden evitar la redundància de dades per disseny. També poden participar en pràctiques de normalització de dades que poden solucionar anomalies d’actualització i altres tipus d’anomalies estandarditzant les maneres de guardar els registres de les taules de bases de dades. Els administradors de bases de dades també poden dur a terme esforços de deduplicació de dades que netegen i estandarditzen dades d'altres maneres. Tot això serveix per crear taules de bases de dades més netes, fer més consistents els registres de bases de dades i prevenir tots els mals de cap i problemes complexos associats a la redundància de dades no planificades.