Elasticsearch e Porterstem Analyzer
-
28-10-2019 - |
Domanda
Sto cercando di utilizzare Elasticsearch per fornire le funzioni di ricerca del nostro sito.
Ne ho sperimentato ma non riesco a abilitare l'analizzatore di Porterstem (in modo che una ricerca di combattimento corrisponda a combattimenti e combattimenti).
Ecco un riassunto del mio contributo.
curl -XPUT localhost:9200/local/ -d'
index :
analysis :
analyzer :
stemming :
type : custom
tokenizer : standard
filter : [standard, lowercase, stop, porterStem]
'
curl -XPUT localhost:9200/local/_mapping -d'{"properties": { "title" : { "analyzer" : "stemming", "type" : "string" }}}'
curl -XPUT localhost:9200/local/article/1 -d'{"title": "Fight for your life"}'
curl -XPUT localhost:9200/local/article/2 -d'{"title": "Fighting for your life"}'
curl -XPUT localhost:9200/local/article/3 -d'{"title": "My dad fought a dog"}'
curl -XPUT localhost:9200/local/article/4 -d'{"title": "Bruno fights Tyson tomorrow"}'
Tuttavia, eseguire una ricerca di "combattimento" corrisponde solo alla prima voce, quella che contiene il termine esatto.
curl -XGET localhost:9200/local/_search?q=fight
Le impostazioni corrette sembrano essere state impostate ma non sembra funzionare.
"indices" : {
"local" : {
"aliases" : [ ],
"settings" : {
"index.analysis.analyzer.stemming.type" : "custom",
"index.analysis.analyzer.stemming.tokenizer" : "standard",
"index.analysis.analyzer.stemming.filter.1" : "lowercase",
"index.analysis.analyzer.stemming.filter.0" : "standard",
"index.analysis.analyzer.stemming.filter.3" : "porterStem",
"index.analysis.analyzer.stemming.filter.2" : "stop",
"index.number_of_shards" : "5",
"index.number_of_replicas" : "1"
},
Qualcuno ha ottenuto questa funzionalità e funzionare e in grado di indicarmi nella giusta direzione?
Soluzione
C'è una configurazione di esempio sull'uso degli analizzatori personalizzati, usando lo Snowball Stemmer:Perché Elasticsearch non sta trovando il mio mandato