Wo finde ich eine Liste mit 'Stop' Wörtern für die Oracle FullText -Suche?
-
24-10-2019 - |
Frage
Ich habe einen Client, der die Volltext -Suche (Beispiel unten) auf einer neuen Oracle UCM -Site testet. Die zufällige Textzeichenfolge, die sie testen wollten, war 'nur testet'. Was scheiterte; Aus meinen Tests scheint es 'nur' ein reserviertes Wort, da es nie von einer Volltextsuche zurückgegeben wird (es wird von Metadatensuche zurückgegeben).
Ich habe den Morgen damit verbracht, Oracle.com zu suchen und gefunden Dies Was ziemlich umfassend erscheint, hat aber nicht nur "nur".
Meine Frage ist also also, dass es 'nur' ein reserviertes Wort ist. Wo finde ich eine vollständige Liste reservierter Wörter für Oracle Volltextsuche (10G)?
Beispiel für Volltext -Suchzeichenfolge;
(<ftx>test only</ftx>)
Aktualisieren. Ich habe noch einige Tests durchgeführt. Es scheint, dass es Wörter ignoriert, die Orte oder Zeiten anzeigen; nur, einige, bis, wann, wo, wo, dort, hier, in der Nähe, das, wer, ungefähr das, sie.
Kann jemand das bestätigen? Ich kann das Oracle nirgendwo finden.
Aktualisieren 2. Antwort Post Ich hätte nach "Stop" -Wörtern nicht "reserviert" suchen sollen. Aktualisierte den Fragen der Frage und den zu reflektierten Tags.
Lösung
Ich wette, das System versucht, häufig vorkommende Wörter automatisch zu ignorieren. Das würde erklären, warum Sie "nur" nicht "aber" nicht "gefunden werden können. Kannst du nach 'a', 'an', ...
Die Liste, die Sie von Wörtern gegeben haben, die nicht funktionieren, sieht aus wie einige sehr häufige Wörter, die häufig nicht die Hauptwörter in einem Satz sind. In Anbetracht dessen sind sie wahrscheinlich keine Wörter, nach denen Sie bei einer Volltextsuche suchen.
Wie sind die Chancen, dass Sie nach einem Artikel suchen, der das Wort "Das" enthält, und die Aufnahme dieses Wortes ist die einzige Tatsache, die Sie in den Artikel haben?
Ich glaube, ich habe Ihre Liste gefunden ... Ironischerweise von der Wiki -Seite der letzten Firma, die ich angefangen habe ..: http://www.sugarcrm.com/wiki/index.php?title=overview_full_text_stop_words#default_stop_words_.28for_english.29
2.10.3 Modifying the Default Stoplist The default stoplist is always named CTXSYS.DEFAULT_STOPLIST. You can use the following procedures to modify this stoplist:
• CTX_DDL.ADD_STOPWORD
• CTX_DDL.REMOVE_STOPWORD
• CTX_DDL.ADD_STOPTHEME
• CTX_DDL.ADD_STOPCLASS
When you modify CTXSYS.DEFAULT_STOPLIST with the CTX_DDL package, you must re-create your index for the changes to take effect.
Standard -Stoppword -Liste:
a he out up
be more their at
had one will from
it than and is
only when corp not
she also in says
was by ms to
about her over
because most there
has or with
its that are
of which could
some an inc
we can mz
after his s
been mr they
have other would
last the as
on who for
such any into
were co no
all if so
but mrs this
UPDATE - Ein schönes Whitepaper von Oracle, das enthält, wie Volltextsuche funktioniert, kann heruntergeladen werden: http://www.oracle.com/technology/products/text/pdf/text_techwp.pdf. Sie erwähnen die Stoppwörter und die Tatsache, dass es eine Standardliste gibt, aber die Wörter selbst nicht erwähnen.
Andere Tipps
Zusätzliche Antworten:
Siehe Standard -Stopword -Listen von Oracle (11G) hier: http://download.oracle.com/docs/cd/b28359_01/text.111/b28304/astopsup.htm#i634475
Die folgende Abfrage ermöglicht die Auflistung von Stoppwörtern von allen Stopplisten (aufzutragen
CTXSYS
Schema):
SELECT * FROM DR$STOPWORD LEFT JOIN DR$STOPLIST ON DR$STOPWORD.SPW_SPL_ID = DR$STOPLIST.SPL_ID
In den Ergebnissen die SPL_*
Felder kommen von der DR$STOPLIST
Systemtabelle und die SPW_*
Felder aus dem DR$STOPWORD
Tisch
- Aus einem Benutzerschema können benutzerdefinierte Stopplisten und Stoppwörter durch abgerufen werden
SELECT * FROM CTX_USER_STOPLISTS;
SELECT * FROM CTX_USER_STOPWORDS;
Schlüsselwörter reserviert:http://www.toadworld.com/knowledge/knowledgexpertfororacle/tabid/648/topicid/sql15/default.aspxKlicken Sie links auf "Keyword Reserved Wörter".
"Nur" ist in der Liste.
Ich bin mir nicht sicher, was in Ihrem Fall vor sich geht, aber ich kann mir nicht vorstellen, dass Oracle das Wort nicht nur bei Volltextsuche unterstützt. In vielen Volltextfällen müssen Sie nach einem Wort suchen. Könnte das das Problem sein, auf das Sie begegnen?