Solrの言語ステマーに関する説明が必要です
質問
私はアラビア語のテキストのための検索エンジンを開発するためのSolrとnutchを使用しています.私はアラビア語のテキストにステマーを実装する必要があり、Solr Stemmerを検索している間に、これら2つのフィルターを提供することがわかりました
<filter class="solr.ArabicNormalizationFilterFactory"/>
<filter class="solr.ArabicStemFilterFactory"/>
私はそれらを試しましたが、彼らが何をしているのか理解できませんでした。.だから、誰かがいくつかの例で私を助けることができますか??
そして、これら二つは、これを行うか:
↑↑↑↑を
↑↑↑↑を
お疲れさまでした。.
解決
あなたはここでいくつかの詳細を見つけることができます: http://lucene.apache.org/core/3_6_0/api/contrib-analyzers/org/apache/lucene/analysis/ar/ArabicStemmer.html
それは言う:
ステミングは次のように定義されます:
- 添付された定冠詞、接続詞、および前置詞の削除。
- 一般的な接尾辞のステミング。
所属していません StackOverflow