Frage

Ich verwende Nutch mit Solr, um eine Suchmaschine für arabische Texte zu entwickeln.Ich muss einen Stemmer an meinen arabischen Texten umsetzen, und während ich auf Solr-Stemmer serching habe, fand ich, dass es diese beiden Filter bereitstellt

<filter class="solr.ArabicNormalizationFilterFactory"/>

<filter class="solr.ArabicStemFilterFactory"/>

Ich habe sie ausprobiert, aber nicht verstanden, was sie tun .. Also kann mir jemand mit einigen Beispielen helfen?

und tun diese beiden dies:

العملات stemmed nach عملة

البساتين, بساتينكم stemmed nach بستان

danke.

War es hilfreich?

Lösung

Sie finden hier einige Details: http://lucene.apache.org/core/3_6_0/api/contrib-analyzers/And/apache/lucene/analysis/ar/aRabörtichMer.html

das sagt:

stemming ist definiert als:

  • Entfernung des angehängten definierten Artikels, Konjunktion und Präpositionen.
  • stammende gemeinsame Suffixe.
Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top