ドキュメントライブラリ内で列を通過するようにクロールを設定する方法はありますか?
-
16-10-2019 - |
質問
私はそのライブラリ内の列をcraう必要がありますが、ドキュメント自体内のテキストをcraいない文書ライブラリがあります。ドキュメントは、スキャナーからのocr'd pdfのものです。これをセットアップする方法はありますか?
解決
デフォルトでは、IFilterをインストールしてもらうと、SPはPDFをインデックス作成しません。したがって、ifilterを持っていない場合、心配する必要はない場合、インデックスが表示されません。
一方、PDFインデックスのifilterがある場合、クロールの一部のみを除外するための作業が必要です。このタイプのシナリオに設定できる「設定」はありません。
私が簡単に考えることができる唯一の仕事(これは理論です)は、ドキュメントライブラリからドキュメント添付ファイルを使用してリストに変換することです。その後、中央管理では、検索結果からドキュメントURLを除外します。検索中のURLを含むものはすべて削除されます。
ドキュメントライブラリの列はそのドキュメントにリンクされるため、ドキュメントリンクは検索結果の一部であるため、列エントリを含むすべてのインデックスから削除されます。
リストの添付ファイルとしては、単なる別の列アイテムであり、他の列リンクではなくその列リンクのみを除外するため、他の列データで検索できるはずです。
これ以外では、おそらくソリューションの検索オブジェクトモデルを掘り下げる必要があります。大量のアイテムの場合、これは多くの作業であり、継続的に更新する必要がある場合は、とにかくオブジェクトモデルを介して自動化する必要があります。
そうしなかった場合は、それがあなたにいくつかのアイデアを与えたことを願っています。
所属していません sharepoint.stackexchange