En temps passats, quan es pensava en dades digitals, tenia sentit segregar les dades entre les dades transaccionals, les dades capturades en aplicacions empresarials, emmagatzemades en taules de bases de dades i presentades per eines de BI i totes les altres dades: correus electrònics, pàgines web, imatges, vídeo. etcètera. Avui dia solem fer referència a "altres dades" com a dades no estructurades.
No obstant això, es podia analitzar i el programari per obtenir valor a partir d’aquestes dades ha travessat l’abisme. Va ser aquell imperatiu analític més que qualsevol cosa que va donar lloc al concepte original de llac de dades, un magatzem de dades per a ambdues espècies de dades i, addicionalment, a dades recollides de diverses fonts externes al negoci, algunes de les quals inevitablement no estructurades.
En aquest treball, examinarem com el nou ecosistema creat pel llac de dades ja no consistirà totalment en les transaccions (o esdeveniments) del negoci. També inclourà dades d’altres fonts, que l’empresa utilitza per realitzar analítiques i informarà als seus usuaris d’informació important sobre quines decisions es poden basar. El sistema de registre serà, com sempre, la còpia daurada de les dades corporatives i la pista d’auditoria de les activitats informàtiques del negoci.