質問

私は私が確かに達成できることがわからない質問をしています。私はSharePoint Search Specialistではないことに注意してください。 複数のコンテンツソースがあります。すべてがうまくいっています。

最近、私たちは大量の新しいサイトを追加しました(1.5TB!)、残念ながらコンテンツをクロールする必要があります(データが静的の数ヶ月ごとに1ヶ月に1回)。私の問題は私がこのサイトの完全なクロールを始めると、それは他のコンテンツソースを殺すことが、10分ごとに実行されなければならず、通常約5分で終了しなければならないインクリメンタルクロールを殺すことです。

他のサーバーは、よりクロールコンポーネントを追加できる場所で利用できるサーバーがありますが、私が知っている限り、問題を解決することはできません。クロール時間を短くすることで少し軽減します。

サーバー1をコンテンツソース1とサーバー2に責任を持つように指定することができます。それは可能ですか?また、高速検索があることに注意してくださいが、問題を解決できるかどうかはわかりません。どんなフィードバックも理解されます。

役に立ちましたか?

解決

This isn't really possible without having multiple farms each with a separate Search Service Instance.

I would suggest you basically split out your 1.5TB of content into a separate farm with a dedicated Search instance. You can even use HOSTS entries on the crawl servers so they have their own local dedicated WFE servers for the crawl process to iterate through:

Farm 1 - Main Farm (business as usual) Farm 2 - 1.5TB Content and Specialist Search Farm

You can then federate the services you need between the two.

The alternative (which is a bit less documented but arguably more ideal) is to use the "Request Management" service which allows you to route specific service requests to specific servers. I don't really know too much about how that all works though..

他のヒント

I would do the following:

  1. priorize the incremental crawl with "high"
  2. priorize the new content source with "low"
  3. limit the requests to the new site in crawler impact rules
  4. start the crawl on friday night and pause it on monday - repeat until you have the main chunk indexed (use powershell to automate)

With this the impact should not be that hard.

ライセンス: CC-BY-SA帰属
所属していません sharepoint.stackexchange
scroll top