Pregunta

Estoy usando Nutch con Solr para desarrollar un motor de búsqueda para textos árabes.Necesito implementar un mierno en mis textos árabes, y mientras se estremecía en Solr Stemmer, encontré que proporciona a esos dos filtros

<filter class="solr.ArabicNormalizationFilterFactory"/>

<filter class="solr.ArabicStemFilterFactory"/>

Los probé, pero no entendí lo que hacen ... ¡así que, por favor, alguien puede ayudarme con algunos ejemplos?

y haz estos dos hacen esto:

العملات STEMMED TO عملة

البساتين, بساتينكم stemmed to بستان

Gracias.

¿Fue útil?

Solución

Puede encontrar algunos detalles aquí: http://lucene.apache.org/core/3_6_0/api/concib-analyzers/org/apache/lucene/analysis/ar/arabicstemmer.html

que dice:

stemming se define como:

  • eliminación de un artículo definido adjunto, conjunción y preposiciones.
  • stemming de sufijos comunes.
Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top