Taula de continguts:
Definició: què significa Apache Nutch?
Apache Nutch és un producte de programari de rastreig web que es pot utilitzar per agrupar dades del web. S'utilitza conjuntament amb altres eines Apache, com Hadoop, per a l'anàlisi de dades.
Techopedia explica Apache Nutch
Apache Nutch és un producte de codi obert amb llicència de la Apache Software Foundation. Aquesta comunitat de desenvolupadors posseeix llicències per a una gamma d'eines de programari Apache que poden ordenar i analitzar dades. Una de les tecnologies centrals és Apache Hadoop, una eina d’analítica de dades gran que és molt popular en l’àmbit empresarial.
Juntament amb eines com Apache Hadoop i funcions per a emmagatzemar, analitzar arxius i molt més, la funció de Nutch és recollir i emmagatzemar dades de la web mitjançant l’ús d’algoritmes d’exploració web.
Els usuaris poden aprofitar senzilles ordres d'Apache Nutch per recopilar informació sota URL. Els usuaris solen utilitzar Apache Nutch juntament amb una altra eina de codi obert, un marc anomenat Apache Solr, que pot actuar com a dipòsit per a les dades recollides amb Apache Nutch.
