質問

に従って この質問 サイトコレクションを移動すると、検索結果から落ちます。私たちの最後のフルクロールは8日以上かかりましたが、それが起こっている間、私たちは幸せなユーザーにはなりません。

ほぼテラバイトのデータを備えた21のコンテンツデータベースに約100,000のサイトコレクションが配布されています。サイトコレクションは、基本的に自立したプロジェクトです。プロジェクトが終了したら、サイトコレクションをアーカイブコンテンツデータベースにアーカイブして、ドキュメントがまだ利用可能で検索可能になるようにします。残念ながら、サイトコレクション(STSADMを使用)を移動すると、検索インデックスからすべてのアイテムが削除されます。

そのため、コンテンツデータベースごとにサイトをコンテンツソースに分割することを考えてきました。その後、他のコンテンツソースのすべての増分検索結果を失うことなく、1〜2週間にわたってさまざまなコンテンツデータベースの完全なクロールを徐々に実行できます。ただし、コンテンツソースにコンテンツデータベースをクロールすることは、SharePoint 2007コンテンツソースではオプションではありません。

ライブデータベースには約2,000個のサイトコレクションがあり、アーカイブコンテンツデータベースには約10,000個のサイトコレクションがあります。コンテンツデータベースでサイトコレクションのリストを取得し、そのリストを使用するコンテンツソースを持つことができますが、10,000を超えるエントリは少し大きいかもしれません。

検索負荷の配布について良いアイデアを得た人はいますか?

役に立ちましたか?

解決

個別のコンテンツソースを持つことは良い考えです。クロールスケジュールを個別に管理する場合は、これが必要です。推奨される制限は、コンテンツソースごとに100の開始アドレス、検索アプリケーションごとに50のコンテンツソースです。

コンテンツソースに多くのスタートURLを追加するのではなく、サポートされている制限の外側に管理するのが難しく、コンテンツデータベースのすべてのサイトコレクションへのリンクを含む動的ページを作成し、使用するのが簡単になる場合があります。コンテンツソースの開始アドレスとして。

コンテンツあたり10,000個のサイトコレクションデータベースは少し高く聞こえます(推奨最大値は5000です)。

ライセンス: CC-BY-SA帰属
所属していません sharepoint.stackexchange
scroll top