Taula de continguts:
- Definició: què significa Open Analytics de dades de gran font?
- Techopedia explica Analytics de dades de codi obert
Definició: què significa Open Analytics de dades de gran font?
L’anàlisi de dades de dades obertes de codi obert es refereix a l’ús de programari i eines de codi obert per a analitzar grans quantitats de dades per tal de recopilar informació rellevant i accionable que una organització pot utilitzar per aconseguir els seus objectius comercials. El principal jugador d’analítica de dades de codi obert és Apache's Hadoop: és la biblioteca de programari més utilitzada per processar enormes conjunts de dades en un grup d’ordinadors mitjançant un procés distribuït per al paral·lelisme.
Techopedia explica Analytics de dades de codi obert
L’analítica de dades de codi obert fa ús de programari i d’eines de codi obert per executar analítiques de dades grans mitjançant una plataforma de programari sencera o diverses eines de codi obert per a diferents tasques en el procés d’analítica de dades. Apache Hadoop és el sistema més conegut per a l'analítica de dades grans, però es requereixen altres components abans que es pugui combinar un sistema analític real.
Hadoop és la implementació de codi obert de l'algorisme MapReduce pioner per Google i Yahoo, per la qual cosa és la base de la majoria dels sistemes d'analítica actuals. Moltes eines d’analítica de dades grans utilitzen el codi obert, inclosos sistemes de base de dades robustos com el MongoDB de codi obert, una base de dades NoSQL sofisticada i escalable molt adequada per a aplicacions de big data, així com d’altres.
Els serveis d’analítica de dades de codi obert inclouen:
- Sistema de recollida de dades
- Centre de control d'administració i seguiment de clústers
- Biblioteca d'aprenentatge automàtic i mineria de dades
- Servei de coordinació d’aplicacions
- Motor de càlcul
- Marc d’execució




