Pourquoi ne puis-je explorer la tourbière standard des sites Internet HTML?

https://sharepoint.stackexchange.com/questions/13799

16-10-2019
|

Question

Cela vient dans les journaux d'analyse:

Access is denied. Verify that either the Default Content Access Account has access to this repository, or add a crawl rule to crawl this repository. If the repository being crawled is a SharePoint repository, verify that the account you are using has "Full Read" permissions on the SharePoint Web Application being crawled.

Maintenant, cela se produit pour un tas de sites qui ont une seule chose en commun, ils sont HTML statique.

Ce n'est pas un problème de réalimentation, cela se produit, peu importe ce site que je pointe vers. Il ne devrait pas être un compte d'accès au contenu problème parce que, bon, ce sont des sites destinés au public. Que se passe-t-il?

La solution

HA! Clouant.

J'ai eu un oeil sur les journaux d'une boîte IIS dans notre zone démilitarisée qui montrait la même activité. Il se trouve dans l'accès IIS anonyme a été activé (bien sûr), ainsi que l'authentification intégrée Windows. Donc ce qui se passe est que l'araignée tente d'utiliser ses pouvoirs (qui ne sont pas bons sur cette machine car il est pas sur le domaine) au lieu de demander les pages de façon anonyme. Si je désactive l'authentification intégrée, il indexe OK. Donc je suppose que je change juste le compte d'accès au contenu ou quelque pour cette source de contenu.

Autres conseils

Le compte de service par votre robot ne peut pas avoir des paramètres proxy nécessaires configurés.

Jetez un oeil dans votre ULS ou Windows application des journaux d'événements pour plus de détails.

Licencié sous: CC-BY-SA avec attribution

Non affilié à sharepoint.stackexchange