Necesita explicación en el terrorismo del lenguaje de SOLR.
Pregunta
Estoy usando Nutch con Solr para desarrollar un motor de búsqueda para textos árabes.Necesito implementar un mierno en mis textos árabes, y mientras se estremecía en Solr Stemmer, encontré que proporciona a esos dos filtros
<filter class="solr.ArabicNormalizationFilterFactory"/>
<filter class="solr.ArabicStemFilterFactory"/>
Los probé, pero no entendí lo que hacen ... ¡así que, por favor, alguien puede ayudarme con algunos ejemplos?
y haz estos dos hacen esto:
العملات STEMMED TO عملة
البساتين, بساتينكم stemmed to بستان
Gracias.
Solución
Puede encontrar algunos detalles aquí: http://lucene.apache.org/core/3_6_0/api/concib-analyzers/org/apache/lucene/analysis/ar/arabicstemmer.html
que dice:
stemming se define como:
- eliminación de un artículo definido adjunto, conjunción y preposiciones.
- stemming de sufijos comunes.