Question

J'ai une question que je ne suis pas sûre peut être atteinte.Notez que je ne suis pas un spécialiste de la recherche SharePoint. Nous avons plusieurs sources de contenu.Tout fonctionne bien.

Récemment, nous avons ajouté un nouveau site qui est massif (1,5 To!) et, malheureusement, nous devons ramper le contenu (une fois tous les quelques mois que les données sont statiques).Mon problème est qu'une fois que je commence une analyse complète de ce site, il tue les autres sources de contenu des crawls incrémentiels qui doivent courir toutes les 10 minutes et se termine normalement en environ 5 minutes.

Nous avons d'autres serveurs disponibles où je peux ajouter davantage de composants de crawl, mais aussi loin que je sache, cela ne résoudra pas le problème, il va simplement y atténuer un peu en faisant tomber les temps de rampe.

Comment puis-je spécifier que le serveur 1 doit être responsable de la source de contenu 1 et du serveur 2 le reste.Est-ce possible?Notez également que nous avons une recherche rapide, mais je ne suis pas sûr que cela puisse résoudre le problème non plus.Tous les commentaires seraient appréciés.

Était-ce utile?

La solution

This isn't really possible without having multiple farms each with a separate Search Service Instance.

I would suggest you basically split out your 1.5TB of content into a separate farm with a dedicated Search instance. You can even use HOSTS entries on the crawl servers so they have their own local dedicated WFE servers for the crawl process to iterate through:

Farm 1 - Main Farm (business as usual) Farm 2 - 1.5TB Content and Specialist Search Farm

You can then federate the services you need between the two.

The alternative (which is a bit less documented but arguably more ideal) is to use the "Request Management" service which allows you to route specific service requests to specific servers. I don't really know too much about how that all works though..

Autres conseils

I would do the following:

  1. priorize the incremental crawl with "high"
  2. priorize the new content source with "low"
  3. limit the requests to the new site in crawler impact rules
  4. start the crawl on friday night and pause it on monday - repeat until you have the main chunk indexed (use powershell to automate)

With this the impact should not be that hard.

Licencié sous: CC-BY-SA avec attribution
Non affilié à sharepoint.stackexchange
scroll top