Taula de continguts:
- Definició: què significa el descobriment de coneixement a les bases de dades (KDD)?
- Techopedia explica el descobriment de coneixement en bases de dades (KDD)
Definició: què significa el descobriment de coneixement a les bases de dades (KDD)?
El descobriment de coneixement en bases de dades (KDD) és el procés de descobriment de coneixement útil a partir d’una col·lecció de dades. Aquesta tècnica d’exploració de dades àmpliament utilitzada és un procés que inclou la preparació i selecció de dades, la neteja de dades, la incorporació de coneixements previs sobre conjunts de dades i la interpretació de solucions precises dels resultats observats.
Les principals àrees d’aplicació del KDD inclouen màrqueting, detecció de fraus, telecomunicacions i fabricació.
Techopedia explica el descobriment de coneixement en bases de dades (KDD)
Tradicionalment, la mineria de dades i el descobriment de coneixement es feien manualment. A mesura que passava el temps, la quantitat de dades de molts sistemes creixia fins a la mida de terabyte i ja no es podia mantenir manualment. A més, per a l'existència exitosa de qualsevol negoci, es considera imprescindible descobrir patrons subjacents en dades. Com a resultat, es van desenvolupar diverses eines de programari per descobrir dades ocultes i fer supòsits, que van formar part de la intel·ligència artificial.
El procés KDD ha assolit el punt àlgid dels darrers deu anys. Actualment, inclou molts enfocaments diferents per al descobriment, que inclou l'aprenentatge inductiu, estadístiques bayesianes, optimització de consultes semàntiques, adquisició de coneixements per a sistemes experts i teoria de la informació. L’objectiu final és extreure coneixement d’alt nivell de dades de baix nivell.
KDD inclou activitats multidisciplinàries. Això inclou l’emmagatzematge i l’accés a les dades, escalant algoritmes a conjunts de dades massius i interpretant resultats. El procés de neteja de dades i accés a dades inclòs al magatzem de dades faciliten el procés KDD. La intel·ligència artificial també dóna suport a la KDD descobrint lleis empíriques a partir de l’experimentació i de les observacions. Els patrons reconeguts en les dades han de ser vàlids amb dades noves i tenir cert grau de certesa. Aquests patrons es consideren nous coneixements. Els passos implicats en tot el procés KDD són:
- Identificar l’objectiu del procés KDD des de la perspectiva del client.
- Comprendre els dominis d'aplicacions implicats i el coneixement que es requereix
- Seleccioneu un conjunt de dades objectiu o un subconjunt de mostres de dades en què es faci un descobriment.
- Netegeu i preprocesseu dades mitjançant la decisió d’estratègies per gestionar els camps que falten i alterar les dades segons els requisits.
- Simplifiqueu els conjunts de dades suprimint variables no desitjades. A continuació, analitzeu les funcions útils que es poden utilitzar per representar les dades, segons l'objectiu o la tasca.
- Relaciona els objectius del KDD amb els mètodes d’explotació de dades per suggerir patrons ocults.
- Trieu algorismes de mineria de dades per descobrir patrons ocults. Aquest procés inclou decidir quins models i paràmetres poden ser adequats per al procés global del KDD.
- Cerqueu patrons d'interès en una forma representativa particular, que incloguin regles de classificació o arbres, regressió i agrupació.
- Interpretar coneixements essencials a partir dels patrons minats.
- Feu servir el coneixement i incorporeu-lo a un altre sistema per a més accions.
- Documentar-lo i fer informes per a les persones interessades.