Brauche Erklärung zur Sprache stemmer von solr
Frage
Ich verwende Nutch mit Solr, um eine Suchmaschine für arabische Texte zu entwickeln.Ich muss einen Stemmer an meinen arabischen Texten umsetzen, und während ich auf Solr-Stemmer serching habe, fand ich, dass es diese beiden Filter bereitstellt
<filter class="solr.ArabicNormalizationFilterFactory"/>
<filter class="solr.ArabicStemFilterFactory"/>
Ich habe sie ausprobiert, aber nicht verstanden, was sie tun .. Also kann mir jemand mit einigen Beispielen helfen?
und tun diese beiden dies:
العملات stemmed nach عملة
البساتين, بساتينكم stemmed nach بستان
danke.
Lösung
Sie finden hier einige Details: http://lucene.apache.org/core/3_6_0/api/contrib-analyzers/And/apache/lucene/analysis/ar/aRabörtichMer.html
das sagt:
stemming ist definiert als:
- Entfernung des angehängten definierten Artikels, Konjunktion und Präpositionen.
- stammende gemeinsame Suffixe.