Где я могу найти список слов «остановить» для поиска по полнотексту Oracle?
-
24-10-2019 - |
Вопрос
У меня клиент тестирует полный текст (пример ниже) на новом сайте Oracle UCM. Случайная текстовая строка, которую они выбрали для тестирования, была «Тест только». Который потерпел неудачу; Из моего тестирования кажется «единственным», является зарезервированным словом, так как оно никогда не возвращается из полного текстового поиска (оно возвращается из поиска метаданных).
Я провел утренний поиск Oracle.com и нашел это что кажется довольно полным, но не имеет «только».
Итак, мой вопрос, таким образом, «только» зарезервированное слово. Где я могу найти полный список зарезервированных слов для полного текстового поиска Oracle (10G)?
Полный текстовый поиск строки пример;
(<ftx>test only</ftx>)
Обновлять. Я сделал еще несколько тестирования. Кажется, он игнорирует слова, которые указывают места или время; Только некоторые, пока, когда, в то время как, где, здесь, рядом, это, кто, об этом, их.
Кто -нибудь может подтвердить это? Я не могу найти это в Oracle.
Обновление 2. Разместите ответ Я должен был искать «остановить» слова, а не «зарезервированные». Обновил заголовок вопроса и теги, чтобы отразить.
Решение
Бьюсь об заклад, система пытается автоматически игнорировать часто встречающиеся слова. Это объяснило бы, почему вы не можете найти «только», но можно найти «onnly». Можете ли вы искать «a», 'an', ...
Список, который вы дали из слов, которые не работают, выглядит как некоторые очень распространенные слова, которые часто не являются основными словами в предложении. Учитывая это, они вряд ли будут словами, которые вы ищете на полном текстовом поиске.
Каковы шансы, что вы ищете статью, которая включает в себя слово «это», и включение этого слова является единственным фактом, который у вас есть в статье?
Я думаю, что нашел ваш список .... по иронии судьбы на странице вики последней компании, которую я начал ..: http://www.sugarcrm.com/wiki/index.php?title=overview_of_full_text_stop_words#default_stop_words_.28for_english.29
2.10.3 Modifying the Default Stoplist The default stoplist is always named CTXSYS.DEFAULT_STOPLIST. You can use the following procedures to modify this stoplist:
• CTX_DDL.ADD_STOPWORD
• CTX_DDL.REMOVE_STOPWORD
• CTX_DDL.ADD_STOPTHEME
• CTX_DDL.ADD_STOPCLASS
When you modify CTXSYS.DEFAULT_STOPLIST with the CTX_DDL package, you must re-create your index for the changes to take effect.
СПИСОК СТОПОДА по умолчанию:
a he out up
be more their at
had one will from
it than and is
only when corp not
she also in says
was by ms to
about her over
because most there
has or with
its that are
of which could
some an inc
we can mz
after his s
been mr they
have other would
last the as
on who for
such any into
were co no
all if so
but mrs this
ОБНОВЛЕНИЕ - Хороший белый документ от Oracle, который включает в себя, как можно загрузить полное текстовое поиск из: http://www.oracle.com/technology/products/text/pdf/text_techwp.pdf. Анкет Они упоминают стоп -слова и тот факт, что есть список по умолчанию, но не упоминают сами слова.
Другие советы
Дополнительные ответы:
См. Списки Oracle Oracle (11G) ЗДЕСЬ: http://download.oracle.com/docs/cd/b28359_01/text.111/b28304/astopsup.htm#i634475
Следующий запрос позволяет перечислять стоп -слова от всех списков (для запуска
CTXSYS
схема):
SELECT * FROM DR$STOPWORD LEFT JOIN DR$STOPLIST ON DR$STOPWORD.SPW_SPL_ID = DR$STOPLIST.SPL_ID
В результатах SPL_*
поля поступают из DR$STOPLIST
системная таблица и SPW_*
Поля из DR$STOPWORD
стол
- Из пользовательской схемы, пользовательские ограниченные списки и остановки могут быть извлечены через
SELECT * FROM CTX_USER_STOPLISTS;
SELECT * FROM CTX_USER_STOPWORDS;
Ключевые слова зарезервированы:http://www.toadworld.com/knowledge/knowledgexpertfororacle/tabid/648/topicid/sql15/default.aspxНажмите на «Ключевое слово зарезервированное слова» слева.
«Только» находится в списке.
Я не уверен, что происходит в вашем случае, но я не могу представить, что Oracle не будет поддерживать слово только в полном текстовом поиске. Во многих полных текстовых случаях вы должны искать одно слово. Может ли это быть проблемой, с которой вы сталкиваетесь?