Taula de continguts:
Definició: què significa el rascatge de contingut?
El rascat de contingut és una manera il·legal de robar contingut original d’un lloc web legítim i de publicar el contingut robat a un altre lloc sense el coneixement ni el permís del propietari del contingut. Els rascadors de contingut solen intentar transmetre el contingut robat com a propi i no proporcionen atribucions als propietaris del contingut.
El rascatge de contingut es pot realitzar mitjançant una còpia i enganxa manuals, o bé pot utilitzar tècniques més sofisticades, com ara utilitzar programari especial, programació HTTP o analitzadors HTML o DOM.
Bona part del contingut que és presa de rascades és material amb drets d'autor; Reposar-lo sense el permís del propietari del copyright és un delicte punible. No obstant això, els llocs de rascadors estan allotjats a tot el món i els raspadors que se'ls demana que elimini contingut amb drets d'autor poden simplement canviar els dominis o desaparèixer.
Techopedia explica Raspallat de contingut
Els rascadors de contingut poden conduir trànsit als seus llocs web mitjançant el rastreig de contingut d'alta qualitat, dens i en paraules clau d'altres llocs. Els bloggers són particularment susceptibles d’això, probablement a causa de que és probable que els bloggers individus no llancin un atac legal contra els rascadors. Es recomana que els rascadors continuïn aquesta pràctica, ja que els motors de cerca encara no han trobat una manera efectiva de filtrar contingut únic de contingut rascat, permetent que els rascadors se'n puguin beneficiar.
Els administradors de llocs web poden protegir-se contra raspades mitjançant mesures senzilles, com ara afegir enllaços al seu propi lloc dins del contingut. Això almenys els permetrà obtenir una mica de trànsit de contingut rascat. Entre els mètodes més sofisticats per fer front al rascat per bots es troben:
- Aplicacions comercials anti-bot
- Captura bots amb un puntal i bloqueja les seves adreces IP
- Bloqueig de bot amb codi JavaScript