Frage

Ich habe eine Frage, die ich nicht sicher bin, kann erreicht werden.Beachten Sie, dass ich kein SharePoint-Suchspezialist bin. Wir haben mehrere Inhaltsquellen.Alles läuft gut.

Wir haben kürzlich eine neue Website hinzugefügt, die massiv ist (1.5 TB!), und leider müssen wir den Inhalt kriechen (nur alle paar Monate, wie die Daten statisch sind).Mein Problem ist, dass er, als ich einmal mit einer vollständigen Kriechung dieser Website beginne, die anderen Inhaltsquellen inkrementellen Kriechten tötet, die alle 10 Minuten laufen müssen, und normalerweise in etwa 5 Minuten endet.

Wir haben andere Server, in denen ich weitere Kriechkomponenten hinzufügen kann, aber soweit ich weiß, dass das Problem nicht löst, wird es einfach ein bisschen lindert, indem er die Crawlzeiten heruntergezogen hat.

Wie kann ich angeben, dass Server 1 für den Inhalt Quell 1 und Server 2 den Rest verantwortlich sein sollte.Ist das möglich?Beachten Sie auch, dass wir eine schnelle Suche haben, aber ich bin nicht sicher, ob das Problem entweder lösen kann.Jedes Feedback würde geschätzt.

War es hilfreich?

Lösung

This isn't really possible without having multiple farms each with a separate Search Service Instance.

I would suggest you basically split out your 1.5TB of content into a separate farm with a dedicated Search instance. You can even use HOSTS entries on the crawl servers so they have their own local dedicated WFE servers for the crawl process to iterate through:

Farm 1 - Main Farm (business as usual) Farm 2 - 1.5TB Content and Specialist Search Farm

You can then federate the services you need between the two.

The alternative (which is a bit less documented but arguably more ideal) is to use the "Request Management" service which allows you to route specific service requests to specific servers. I don't really know too much about how that all works though..

Andere Tipps

I would do the following:

  1. priorize the incremental crawl with "high"
  2. priorize the new content source with "low"
  3. limit the requests to the new site in crawler impact rules
  4. start the crawl on friday night and pause it on monday - repeat until you have the main chunk indexed (use powershell to automate)

With this the impact should not be that hard.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit sharepoint.stackexchange
scroll top