Taula de continguts:
Definició: què significa Dades no estructurades?
Les dades no estructurades representen qualsevol dada que no tingui una estructura recognoscible. És desorganitzada i crua i pot ser no textual ni textual. Per exemple, el correu electrònic és una il·lustració fina de dades textuals no estructurades. Inclou hora, data, destinatari i remitent i tema, etc., però un cos de correu electrònic no està estructurat. Les dades no estructurades també es poden identificar com a dades poc estructurades, en què les fonts de dades inclouen una estructura, però no totes les dades d’un conjunt de dades segueixen la mateixa estructura.
En empreses centrades en el client, es poden examinar les dades que es troben en un formulari no estructurat per millorar el màrqueting de relacions i la gestió de relacions amb els clients (CRM). Com que les aplicacions de xarxes socials, com Facebook i Twitter, passen de manera generalitzada, és probable que el desenvolupament de dades no estructurades superi el progrés de les dades estructurades.
Techopedia explica les dades no estructurades
Les dades no estructurades es refereixen a dades que segueixen un formulari menys ordenat que articles com a pàgines de full de càlcul, taules de bases de dades o altres conjunts de dades lineals o ordenats. De fet, el terme "conjunt de dades" és útil perquè s'associa a dades que es troben en matrius netes i accessibles, sense cap contingut addicional, i que estan enllaçades o etiquetades en una estructura específica.
Altres casos de dades textuals no estructurades inclouen documents Word, presentacions de PowerPoint, missatges instantanis, programari de col·laboració, documents, llibres, publicacions de mitjans socials i registres mèdics. Les dades no texturades no textuals es creen generalment en suports, com ara fitxers d’àudio MP3, imatges JPEG i fitxers de vídeo Flash, etc.
Les dades no estructurades normalment no inclouen un model de dades predefinit, i és possible que no coincideixin bé amb les taules relacionals. Les dades no estructurades acostumen a ser pesades de text. Tot i això, pot incloure números i dates, així com fets. Això comporta ambigüitats difícils d’identificar mitjançant programes convencionals de programari.
L’emmagatzematge d’enormes volums de dades no estructurades generades dins d’una empresa, si està mal gestionat, pot comportar despeses més elevades. Les dades en documents impresos o en format electrònic s’han d’escanejar per tal que una aplicació de cerca analitzi idees, depenent de les paraules utilitzades en determinats contextos. Això es coneix com a cerca d’empresa o semàntica.
