Question

J'essaie de faire fonctionner l'analyse sur deux fermes distinctes mais je n'arrive pas à la faire fonctionner sur l'une ou l'autre. Ils ont tous deux deux WFE avec un WFE supplémentaire configuré en tant que serveur d'index. Il existe un autre serveur dédié à Query et deux serveurs principaux SQL 2005 en cluster pour la base de données. J'ai essayé sans succès au moins 50 sites Web différents que j'ai trouvés avec des solutions d'un moteur de recherche. J'ai configuré (étendu) mon application Web pour utiliser http: // nom_serveur: 12345 comme zone par défaut et http://abc.companyname.com en tant que zones personnalisées et intranet. Lorsque j'entre chacun de ces éléments dans la source de contenu, puis que j'essaie d'exécuter une analyse, des erreurs se produisent dans le journal d'analyse:

http: // nom_serveur: 12345 renvoie:
" Impossible de se connecter au serveur. Assurez-vous que le site est accessible. "

http://abc.companyname.com renvoie:
"Supprimé par le cueilleur. (L'adresse de départ ou la source de contenu contenant cet élément a été supprimé et par conséquent cet élément a été supprimé.) "

Cependant, je peux cliquer sur les deux URL pour accéder à la page.

Des idées?

Plus d'infos:

J'ai effacé l'ardoise, pour ainsi dire, et j'ai lancé une autre analyse pour fournir un exemple mis à jour.

Mes sources de contenu sont en tant que telles:

http: // nom_serveur: 33333
http://sharepoint.portal.fake.com
sps3: // nom_serveur: 33333

Mes erreurs de journal d'analyse actuelles sont les suivantes:

sps3: // nom_serveur: 33333
Erreur dans le service Web PortalCrawl.

http: // nom_serveur: 33333 / mysites
Le contenu de cette URL est exclu par le serveur car un attribut sans index.

http: // nom_serveur: 33333 / mysites
Rampé

sts3: // nom_serveur: 33333 / contentdbid = {62a647a ...
Rampé

sts3: // nom_serveur: 33333
Rampé

http: // nom_serveur: 33333
Rampé

http://sharepoint.portal.fake.com
Le Crawler n'a pas pu communiquer avec le serveur. Vérifiez que le serveur est disponible et que l'accès au pare-feu est configuré correctement.

J'ai vérifié deux fois plus de fautes de frappe ci-dessus et je n'en vois pas, donc ça devrait être un reflet juste.

Était-ce utile?

La solution

Il est important de noter que l'analyse des sites SharePoint est différente de l'analyse des partages de fichiers ou des sites Web non-SharePoint.

Quelques autres points rapides:

  • le protocole sps3: permet d'analyser les profils utilisateur pour la recherche de personnes. Vous pouvez ignorer tout ce que le robot d'exploration en dit jusqu'à ce que vous soyez prêt pour les profils utilisateur.
  • votre compte d'analyse est censé avoir accès à l'ensemble de votre batterie de serveurs. Si vous voyez des erreurs d'autorisations, recherchez l'article de la base de connaissances qui explique comment réinitialiser votre compte d'analyse (il s'agit d'une commande stsadm.exe spécifique). Si vous essayez d'analyser le contenu d'une autre batterie de serveurs, vous devrez trouver un autre moyen d'accorder l'accès à votre compte d'analyse. Je pense que c'est votre plus gros problème actuellement.
  • Le robot d'exploration (exécuté à partir du serveur d'index) tentera de visiter l'URL publique. J'ai déjà eu des problèmes de communication entre serveurs; assurez-vous que les trois serveurs peuvent s'interroger, et assurez-vous que le serveur d'index peut atteindre l'URL publique (ouvrez IE sur le serveur d'index et extrayez-le). Si vous avez des problèmes, il est temps de salir le fichier hosts de votre serveur d'index. C'est quelque chose que SharePoint fait pour vous de toute façon, alors ne vous sentez pas trop mal à le faire. Si vous avez configuré autre chose que l'authentification Windows intégrée, vous devrez travailler plus fort pour que votre robot d'exploration fonctionne.

Quoi qu’il en soit, les réponses ont été nombreuses et variées, je ne fais donc que tamiser un tas de suggestions, peut-être que l’une d’entre elles est en ligne de mire.

Autres conseils

Je suis un peu confus quant à la topologie de votre ferme. Une machine installée en tant que WFE ne peut pas être un indexeur. Une machine installée comme "complète" peut être un indexeur, une requête et / ou un wfe ...

De plus, au lieu de changer le compte d'accès au contenu par défaut, vous pouvez ajouter une règle d'analyse (une fois que tout est opérationnel)

Pouvez-vous voir si quelque chose d’utile se trouve dans les% commonprogramfiles% / microsoft shared / extensions de serveur Web / 12 / logs sur votre indexeur?

Le fichier journal peut être un peu détaillé, vous pouvez rechercher " démarré " ou " complet " et cela vous mènera généralement à la ligne du journal où votre analyse a commencé.

De plus, sur votre ordinateur SQL, vous pourrez peut-être obtenir plus d'informations à partir de la table MSScrawlurlhhistory.

Pouvez-vous créer une source de contenu pour http://www.cnn.com et lancer une analyse complète ? Avez-vous les mêmes erreurs?

De plus, nous voudrons peut-être mettre ceci hors ligne, laissez-moi savoir si vous voulez le faire.

Je ne sais pas s'il existe un moyen d'envoyer des messages privés via stackoverflow.

La plupart de vos problèmes sont liés à Kerberos, cela ressemble à. Si la mise à jour de l’infrastructure n’est pas appliquée, Sharepoint ne pourra pas utiliser l’autorisation kerberos sur les sites Web avec des ports non définis par défaut (80/443). C’est aussi pourquoi (je parierais) que vous ne pouvez pas accéder à CA à partir du serveur 5 quand il est sur le serveur 4. Si les SPN ne sont pas configurés correctement, CA ne sera accessible que depuis la machine sur laquelle il est installé. Si vous aviez installé Sharepoint en utilisant le port 80 en tant qu'URL par défaut, vous seriez en mesure d'effectuer l'analyse du point de partage local sans aucun accroc. Mais par conception, l'analyse des sites de points de partage locaux utilise l'URL par défaut pour accéder aux sites de points de partage. Découvrez http://codefrob.spaces.live.com/blog/ cns! 7C69E7B2271B08F6! 363.entry pour un peu plus de détails sur la façon d’obtenir Kerberos & amp; Sharepoint pour bien travailler ensemble.

Dans la section Services sur le serveur, vérifiez les propriétés du compte d'analyse de recherche pour vous assurer qu'il est configuré et qu'il dispose des autorisations nécessaires pour accéder à ces sites.

Merci pour la nouvelle entrée!

Alors je suis rentré de mon week-end et je voulais passer en revue vos pointeurs et essayer chacun d’eux, puis rendre compte de la façon dont ils n’ont pas fonctionné, puis publier les résultats que j’ai obtenus. Une chose amusante s’est toutefois produite.

Je suis allé sur mon indexeur (nom_serveur5) et j'ai essayé de me connecter à l'administrateur central et au portail principal à partir d'Internet Explorer. Ni travaillé. Je suis donc allé dans IIS sur Indexer pour essayer de naviguer vers le portail principal à partir d’IIS. Cela n'a pas fonctionné non plus et j'ai reçu une erreur me disant que quelque chose d'autre utilisait ce port. J'ai donc vu mon ancien site Web de la version précédente et je l'ai supprimé d'IIS avec le pool d'applications correspondant. Ensuite, j'ai démarré le pool d'applications pour le site Web à partir de la nouvelle version et j'ai accédé au site Web. Succès. Ensuite, j'ai navigué sur le site Web à partir du navigateur sur mon propre PC. Encore du succès. Ensuite, j'ai lancé une analyse par l'URL complète, et non par le nom de serveur, comme suit:

http://sharepoint.portal.fake.com

Encore du succès. Il a exploré tout le portail, y compris les sous-sites, exactement comme je le souhaitais. Les " Articles dans l'index " peuplé rapidement et je pouvais dire que je roulais.

Je ne peux toujours pas accéder au site d'administration centrale hébergé sur nomserveur4 à partir nomserveur5. Je ne sais pas pourquoi, mais je ne sais pas si cela compte beaucoup pour le moment.

Où cela me laisse-t-il? Quelle était la solution?

Je ne suis toujours pas sûr. Peut-être que c'était la reconstruction. Peut-être que dès que j'ai reconstruit la batterie de serveurs, je disposais de tout le matériel nécessaire pour que cela fonctionne, mais cela ne fonctionnait tout simplement pas, car l'ancien site Web était toujours dans IIS. (Il est amusant de constater à quel point une désinstallation de SharePoint peut être négligée. La suppression manuelle des bases de données de contenu, des sites Web et des pools d'applications semble nécessaire et cela ne devrait probablement pas être le cas.)

Dans tous les cas, cela fonctionne maintenant sur mon " test " donc la clé est de le faire fonctionner sur la ferme de production. J'espère que ce ne sera pas si difficile après cette expérience.

Merci à tous pour votre aide!

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top