質問

所有している 2 つの別々のファームでクロールを動作させようとしていますが、どちらのファームでも動作させることができません。どちらにも 2 つの WFE があり、追加の WFE がインデックス サーバーとして構成されています。クエリ専用のサーバーがもう 1 台あり、データベース用にクラスタ化された SQL 2005 バックエンド サーバーが 2 台あります。私は検索エンジンからの解決策を見つけて、少なくとも 50 の異なる Web サイトを試しましたが失敗しました。Web アプリを使用するように設定 (拡張) しました。 http://サーバー名:12345 デフォルトゾーンとして、そして http://abc.会社名.com カスタム ゾーンとイントラネット ゾーンとして。これらのそれぞれをコンテンツ ソースに入力してクロールを実行しようとすると、クロール ログにいくつかのエラーが記録されます。

http://サーバー名:12345 戻り値:
"サーバーに接続できませんでした。サイトにアクセスできることを確認してください。」

http://abc.会社名.com 戻り値:
「ギャザラーによって削除されました。(このアイテムを含む開始アドレスまたはコンテンツ ソースが削除されたため、このアイテムは削除されました。)

ただし、両方の URL をクリックすることができ、ページにアクセスできます。

何か案は?


より詳しい情報:

いわば白紙の状態をきれいに拭き、更新されたサンプルを提供するために別のクロールを実行しました。

私のコンテンツソースは次のとおりです。

http://サーバー名:33333
http://sharepoint.portal.fake.com
sp3://サーバー名:33333

現在のクロール ログ エラーは次のとおりです。

sp3://サーバー名:33333
PortalCrawl Web サービスでエラーが発生しました。

http://サーバー名:33333/mysites
この URL のコンテンツは、インデックス属性がないため、サーバーによって除外されます。

http://サーバー名:33333/mysites
クロールされた

sts3://サーバー名:33333/contentdbid={62a647a...
クロールされた

sts3://サーバー名:33333
クロールされた

http://サーバー名:33333
クロールされた

http://sharepoint.portal.fake.com
クローラーはサーバーと通信できませんでした。サーバーが利用可能であること、およびファイアウォール アクセスが正しく構成されていることを確認してください。

上記のタイプミスを再確認しましたが、何も見つからなかったので、これは正確に反映されているはずです。

役に立ちましたか?

解決

覚えておくべき点の 1 つは、SharePoint サイトのクロールは、ファイル共有や非 SharePoint Web サイトのクロールとは異なるということです。

その他の簡単なヒント:

  • SP3:このプロトコルは、People Search のユーザー プロファイルをクロールするためのものです。ユーザー プロファイルの準備が整うまでは、クローラーがそれについて何を言っても無視してかまいません。
  • クロール アカウントはファーム全体にアクセスできることになっています。アクセス許可エラーが発生した場合は、クロール アカウントをリセットする方法 (特定の stsadm.exe コマンド) が記載されている KB 記事を見つけてください。別のファームのコンテンツをクロールしようとしている場合は、クロール アカウントにアクセスを許可するために別の方法を講じる必要があります。これが今のあなたの最大の課題だと思います。
  • クローラー (インデックス サーバーから実行) は、パブリック URL へのアクセスを試みます。以前にもサーバー間通信の問題が発生したことがあります。3 つのサーバーすべてが相互に ping できることを確認し、インデックス サーバーがパブリック URL にアクセスできることを確認します (インデックス サーバーで IE を開いて確認してください)。問題が発生した場合は、インデックス サーバーの hosts ファイルを汚してください。いずれにせよ、これは SharePoint が自動的に実行してくれるものなので、それほど悪く感じる必要はありません。統合 Windows 認証以外に何かを設定している場合は、クローラーを動作させるためにさらに努力する必要があります。

とにかく、返答にはたくさんのやり取りがあったので、私はそこにあるたくさんの提案をただショットガンしているだけですが、おそらくそのうちの1つは的を射ています。

他のヒント

ファームのトポロジについて少し混乱しています。単なる WFE としてインストールされたマシンは、インデクサーになることはできません。「完全」としてインストールされたマシンは、インデクサー、クエリ、および/または WFE として使用できます。

また、デフォルトのコンテンツ アクセス アカウントを変更する代わりに、(すべてが起動して実行されたら) クロール ルールを追加することもできます。

インデクサーの %commonprogramfiles%/microsoftshared/webserverextensions/12/logs に役立つものがあるかどうかを確認できますか?

ログ ファイルは少し冗長である場合があります。「開始済み」または「完全」を検索すると、通常はクロールが開始されたログ内の行に移動します。

また、SQL マシンでは、MSScrawlurlhistory テーブルから詳細情報を取得できる場合があります。

のコンテンツ ソースを作成できますか http://www.cnn.com フルクロールを開始しますか?同じエラーが発生しますか?

また、これをオフラインにしたい場合もありますので、ご希望の場合はお知らせください。

ただし、スタックオーバーフロー経由でプライベートメッセージを送信する方法があるかどうかはわかりません。

問題のほとんどは Kerberos に関連しているようです。インフラストラクチャの更新が適用されていない場合、Sharepoint はデフォルト以外の (80/443) ポートを備えた Web サイトに対して Kerberos 認証を使用できません。これが、サーバー 4 上にある CA にサーバー 5 からアクセスできない理由でもあります (おそらく)。SPN が正しく設定されていない場合、CA は、CA がインストールされているマシンからのみアクセスできます。デフォルト URL としてポート 80 を使用して Sharepoint をインストールした場合は、問題なくローカル Sharepoint クロールを実行できます。ただし、設計上、ローカル SharePoint サイトのクロールでは、デフォルトの URL を使用して SharePoint サイトにアクセスします。チェックアウト http://codefrob.spaces.live.com/blog/cns!7C69E7B2271B08F6!363.entry Kerberos と Sharepoint をうまく連携させる方法についてもう少し詳しく説明します。

[サーバー上のサービス] セクションで、検索クロール アカウントのプロパティをチェックして、アカウントが設定されていること、およびこれらのサイトにアクセスする権限があることを確認します。

新しい入力をありがとうございます!

そこで、週末から戻ってきて、皆さんのアドバイスを参考にしてすべてを試し、それがどのように機能しなかったかを報告し、得られた結果を投稿したいと思いました。しかし、面白いことが起こりました。

インデクサー (servername5) にアクセスし、Internet Explorer から Central Admin とメイン ポータルに接続しようとしました。どちらも機能しませんでした。そこで、Indexer 上の IIS にアクセスして、IIS 内からメイン ポータルを参照しようとしました。それも機能せず、他の何かがそのポートを使用していることを知らせるエラーを受け取りました。そこで、以前のビルドから古い Web サイトを確認し、対応するアプリケーション プールとともに IIS から削除しました。次に、新しいビルドから Web サイトのアプリ プールを開始し、Web サイトを参照しました。成功。次に、自分の PC のブラウザから Web サイトを閲覧しました。またしても成功。次に、次のようにサーバー名ではなく完全な URL でクロールを実行しました。

http://sharepoint.portal.fake.com

またしても成功。私が望んでいたとおりに、サブサイトを含むポータル全体をクロールしました。「インデックス内の項目」がすぐに表示され、順調に進んでいることがわかりました。

まだ、servername5 から、servername4 でホストされている中央管理サイトにアクセスできません。なぜそうしないのかはわかりませんが、現時点ではそれがそれほど重要かどうかはわかりません。

これは私をどこに残してしまうのでしょうか?修正は何でしたか?

まだわかりません。もしかしたら再構築だったのかもしれない。おそらく、サーバー ファームを再構築するとすぐに、動作させるために必要なものがすべて揃ったのですが、以前の Web サイトがまだ IIS にあるため、動作しませんでした。(面白いことに、SharePoint のアンインストールは非常にずさんです。コンテンツ データベース、Web サイト、およびアプリケーション プールを手動で削除する必要があるようですが、おそらくそうすべきではありません。)

いずれにせよ、現在は「テスト」ファームで動作しているため、重要なのは実稼働ファームで動作させることです。この経験を経て、それがそれほど難しくなくなることを願っています。

皆さんのご協力に感謝します!

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top