コンテンツのソースごとの専用サーバー
-
10-12-2019 - |
質問
私は私が確かに達成できることがわからない質問をしています。私はSharePoint Search Specialistではないことに注意してください。 複数のコンテンツソースがあります。すべてがうまくいっています。
最近、私たちは大量の新しいサイトを追加しました(1.5TB!)、残念ながらコンテンツをクロールする必要があります(データが静的の数ヶ月ごとに1ヶ月に1回)。私の問題は私がこのサイトの完全なクロールを始めると、それは他のコンテンツソースを殺すことが、10分ごとに実行されなければならず、通常約5分で終了しなければならないインクリメンタルクロールを殺すことです。
他のサーバーは、よりクロールコンポーネントを追加できる場所で利用できるサーバーがありますが、私が知っている限り、問題を解決することはできません。クロール時間を短くすることで少し軽減します。
サーバー1をコンテンツソース1とサーバー2に責任を持つように指定することができます。それは可能ですか?また、高速検索があることに注意してくださいが、問題を解決できるかどうかはわかりません。どんなフィードバックも理解されます。
解決
This isn't really possible without having multiple farms each with a separate Search Service Instance.
I would suggest you basically split out your 1.5TB of content into a separate farm with a dedicated Search instance. You can even use HOSTS entries on the crawl servers so they have their own local dedicated WFE servers for the crawl process to iterate through:
Farm 1 - Main Farm (business as usual) Farm 2 - 1.5TB Content and Specialist Search Farm
You can then federate the services you need between the two.
The alternative (which is a bit less documented but arguably more ideal) is to use the "Request Management" service which allows you to route specific service requests to specific servers. I don't really know too much about how that all works though..
他のヒント
I would do the following:
- priorize the incremental crawl with "high"
- priorize the new content source with "low"
- limit the requests to the new site in crawler impact rules
- start the crawl on friday night and pause it on monday - repeat until you have the main chunk indexed (use powershell to automate)
With this the impact should not be that hard.