Quelles sont les bonnes méthodes pour empêcher les gratteurs d’écran de récupérer des éléments spécifiques de contenu de mon site?

StackOverflow https://stackoverflow.com/questions/139482

  •  02-07-2019
  •  | 
  •  

Question

Je suis persuadé que cette question compte comme un blasphème pour la plupart des promoteurs du Web 2.0, mais je pense qu'il arrive parfois que vous ne souhaitiez pas vouloir que des éléments de votre site soient facilement extrapolés dans l'agrégateur Web arbitraire de quelqu'un d'autre. . Au moins, assez pour qu'ils aient besoin d'être préparés pour le faire à la main s'ils le voulaient vraiment.

Mon idée était de créer un script qui positionnait les nœuds de texte par des coordonnées absolues dans l'ordre dans lequel ils apparaissaient normalement dans leurs paragraphes respectifs, puis stockait ces nœuds de texte dans un ordre aléatoire, brouillé dans le DOM. Bien sûr, faire en sorte qu'un système comme celui-ci fonctionne correctement (retour à la ligne, alignement, style, etc.) ressemble presque à l'écriture de mon propre moteur de rendu de document.

Je pensais aussi combiner cela avec une chose semblable à celle de CAPTCHA pour modifier le texte de manière subtile de manière à gêner les grattoirs d'écran qui pourraient simplement regarder des instantanés et discerner des lettres ou autres. Mais c'est probablement trop penser.

Hmm. Quelqu'un at-il déjà mis au point de bonnes méthodes pour faire quelque chose comme ça?

Était-ce utile?

La solution

J'ai vu un guide TV décrypter à l'aide de javascript sur le côté client. Cela n'arrêterait pas un racleur déterminé, mais arrêterait la plupart des scripts informels.

Toutes les entrées TV textuelles sont similaires ps10825 ('4VUknMERbnt0OAP3klgpmjs .... abd26') où ps10825 est simplement une fonction qui appelle sa fonction de déchiffrement avec une clé de ps10825. Évidemment, la clé est générée à chaque fois.

Dans ce cas, je pense qu'il est tout à fait approprié d'empêcher 99% des personnes utilisant Greasemonkey ou même des scripts wget de télécharger leur guide TV sans voir toutes leurs publicités.

Autres conseils

Considérez que tout ce que le grattoir ne peut pas lire, les moteurs de recherche ne le peuvent pas non plus. Cela dit, vous pouvez insérer du contenu dans votre document via Javascript après le chargement de la page.

Veuillez ne pas utiliser le positionnement absolu pour réassembler une page brouillée. Cela ne fonctionnera pas pour les appareils mobiles, les lecteurs d'écran pour malvoyants et les moteurs de recherche.

S'il vous plaît, n'ajoutez pas captcha. Cela va simplement chasser les gens avant qu'ils ne voient votre site.

Toute solution que vous proposez sera anti-Web. Internet, c’est une question de partage, et il faut prendre le mal pour le bien.

Si vous devez faire quelque chose, vous pouvez simplement utiliser Flash. Je n'ai encore jamais vu d'agriculteurs de liens récupérer du contenu Flash. Mais pour toutes les raisons énoncées dans le premier paragraphe, Flash est anti-Web.

Vos idées briseraient probablement tous les lecteurs d'écran. Vous devez donc vérifier les exigences en matière d'accessibilité / la législation avant de gâcher les commandes.

Pour comprendre cela, il est préférable d'essayer de gratter quelques sites. J'ai gratté des sites assez difficiles, comme des sites bancaires. J'ai vu de nombreuses tentatives pour rendre difficile le grattage (cryptage, cookies, etc.). En fin de compte, la meilleure défense est le balisage imprévisible. Les grattoirs reposent avant tout sur le fait de pouvoir "donner des motifs". dans le balisage. Dès que le motif change, la logique de raclage échoue. Les grattoirs sont notoirement fragiles et se décomposent facilement.

Ma suggestion: injecter de manière aléatoire du code non visible dans votre code. En particulier autour du contenu susceptible d’être intéressant. Faites tout ce que vous pouvez imaginer pour que votre balisage ait un aspect différent d’un grattoir chaque fois qu’il est appelé.

Affichez tout votre texte dans SVG en utilisant quelque chose comme ImageMagick

Alexa.com fait des trucs loufoques pour éviter les éraflures. Allez ici et regardez le numéro de rang du trafic http://www.alexa.com/data/details/traffic_details/teenormous. com

Peu de ces techniques vont arrêter le déterminé. Alexa-style garbage-HTML / CSS-masking est facile à contourner (il suffit d'analyser le CSS); AJAX / Javascript-DOM-insertion est également facile à utiliser, bien que les jetons d’authenticité des formulaires rendent la tâche plus difficile.

J'ai trouvé qu'un API officiel était le meilleur moyen de dissuasion:)

En dehors de cela, le rendu du texte en image est un bon moyen d’arrêter le grattoir occasionnel (mais reste tout de même faisable)

YouTube utilise également l’obscurcissement javascript, ce qui rend plus difficile le reverse engineering AJAX

Il vous suffit de charger tout votre code HTML via des appels AJAX. Le code HTML n'apparaît pas " apparaît " être dans le DOM pour la plupart des grattoirs d’écran.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top