Demande multiple de 404 sur notre site. Est-ce une attaque ou juste un mauvais robot d'indexation?

StackOverflow https://stackoverflow.com/questions/833662

  •  08-07-2019
  •  | 
  •  

Question

Notre site reçoit des demandes qui tentent d'accéder à des pages non existantes. Il s’agit généralement uniquement d’adresses mal orthographiées. Le lien de droite est /Info/SiteMap.aspx, mais la mauvaise requête est /Inf/SiteMap.aspx avec 'o' manquant. Il y a généralement beaucoup de demandes, comme 20 en rangée en une minute. Tous lancent 404.

Est-ce un problème de robot d’indexation? Ou quelqu'un teste-t-il les lacunes de notre site?

Avez-vous des expériences ou des conseils?

Était-ce utile?

La solution

Oui, considérez les points suivants.

  1. L'adresse IP de l'hôte envoyant les demandes - si elles sont distinctes mais de plusieurs adresses IP, nous pouvons le suspecter comme une attaque distribuée effectuée à l'aide de zombies.

  2. . Si les demandes proviennent de la même source, vérifiez le délai entre les demandes. Généralement, les robots d'exploration n'utilisent pas de temps extrêmement court entre les requêtes.

  3. Les robots d'indexation (Crawlers) n'effectuent pas "Force brute". indexation de type. Ils récupèrent simplement les liens d'une page et traversent récursivement page par page. La raison de cela ne devrait donc pas être un robot d'indexation.

  4. Recherchez des modèles. Je veux dire un modèle de nommage séquentiel, etc.

  

EX: /Inf/SiteMap.aspx, /Infa/SiteMap.aspx, /Infb/SiteMap.aspx

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top