Casa Bases de dades Què és les dades brutes? - Definició de tecnologia

Què és les dades brutes? - Definició de tecnologia

Taula de continguts:

Anonim

Definició: què significa Dirty Data?

Les dades brutes fan referència a dades que contenen informació errònia. També es pot utilitzar quan es refereix a dades que es troben a la memòria i que encara no es carreguen a una base de dades. L’eliminació completa de les dades brutes d’una font no és pràctic o impossible.

Les dades següents es poden considerar com a dades brutes:

  • Dades equivocades
  • Duplicar dades
  • Dades incorrectes
  • Dades incorrectes
  • Dades no integrades
  • Dades que incompleixen les normes comercials
  • Dades sense format format generalitzat
  • Puntuació o puntuació incorrecta de les dades

Techopedia explica les dades brutes

A més de l'entrada incorrecta de dades, es poden generar dades brutes a causa dels mètodes indeguts en la gestió i l'emmagatzematge de dades. A continuació s’expliquen alguns tipus de dades brutes:

  • Dades incorrectes: per garantir que les dades són vàlides o correctes, el valor introduït ha de complir els valors vàlids del camp. Per exemple, el valor introduït al camp del mes hauria de ser d’1 a 12, o l’edat d’una persona ha de ser inferior a 130. La correcció del valor de les dades pot ser aplicada programàticament mitjançant taules de cerca o amb comprovacions d’edició.
  • Dades inexactes: és possible que un valor de dades pugui ser correcte, però no exacte. De vegades, és pràctic examinar contra altres fitxers o camps per esbrinar si el valor de les dades és exacte en funció del context que s’utilitza. Tot i així, la precisió sovint només es pot validar mitjançant verificació manual.
  • Violacions de regles comercials: les dades que incompleixen les regles comercials són un altre tipus de dades brutes. Per exemple, una data d’efectivitat sempre ha d’arribar abans d’una data de caducitat. Un altre exemple de violació de regles comercials pot ser la reclamació d’assegurança de Medicare d’un pacient quan el pacient encara pugui tenir l’edat de jubilació i no tingui dret a Medicare.
  • Dades inconsistents: la redundància de dades no verificada comporta incoherències de dades. A cada organització es veuen afectades dades inconsistents i repetitives. Això és particularment típic amb les dades dels clients.
  • Dades incompletes: les dades amb valors que falten és el tipus principal de dades incompletes.
  • Dades duplicades: es poden produir dades duplicades per enviaments repetits, ajuntament inadequat de dades o error d'usuari.

Per tal d’augmentar la qualitat de les dades i evitar dades brutes, les organitzacions haurien d’incorporar metodologies per assegurar la completa, validesa, coherència i correcció de les dades.

Què és les dades brutes? - Definició de tecnologia