Где я могу найти список слов «остановить» для поиска по полнотексту Oracle?

StackOverflow https://stackoverflow.com/questions/2994464

Вопрос

У меня клиент тестирует полный текст (пример ниже) на новом сайте Oracle UCM. Случайная текстовая строка, которую они выбрали для тестирования, была «Тест только». Который потерпел неудачу; Из моего тестирования кажется «единственным», является зарезервированным словом, так как оно никогда не возвращается из полного текстового поиска (оно возвращается из поиска метаданных).

Я провел утренний поиск Oracle.com и нашел это что кажется довольно полным, но не имеет «только».

Итак, мой вопрос, таким образом, «только» зарезервированное слово. Где я могу найти полный список зарезервированных слов для полного текстового поиска Oracle (10G)?

Полный текстовый поиск строки пример;

(<ftx>test only</ftx>)


Обновлять. Я сделал еще несколько тестирования. Кажется, он игнорирует слова, которые указывают места или время; Только некоторые, пока, когда, в то время как, где, здесь, рядом, это, кто, об этом, их.

Кто -нибудь может подтвердить это? Я не могу найти это в Oracle.


Обновление 2. Разместите ответ Я должен был искать «остановить» слова, а не «зарезервированные». Обновил заголовок вопроса и теги, чтобы отразить.

Это было полезно?

Решение

Бьюсь об заклад, система пытается автоматически игнорировать часто встречающиеся слова. Это объяснило бы, почему вы не можете найти «только», но можно найти «onnly». Можете ли вы искать «a», 'an', ...

Список, который вы дали из слов, которые не работают, выглядит как некоторые очень распространенные слова, которые часто не являются основными словами в предложении. Учитывая это, они вряд ли будут словами, которые вы ищете на полном текстовом поиске.

Каковы шансы, что вы ищете статью, которая включает в себя слово «это», и включение этого слова является единственным фактом, который у вас есть в статье?

Я думаю, что нашел ваш список .... по иронии судьбы на странице вики последней компании, которую я начал ..: http://www.sugarcrm.com/wiki/index.php?title=overview_of_full_text_stop_words#default_stop_words_.28for_english.29

2.10.3 Modifying the Default Stoplist The default stoplist is always named CTXSYS.DEFAULT_STOPLIST. You can use the following procedures to modify this stoplist:
 • CTX_DDL.ADD_STOPWORD
 • CTX_DDL.REMOVE_STOPWORD
 • CTX_DDL.ADD_STOPTHEME
 • CTX_DDL.ADD_STOPCLASS
 When you modify CTXSYS.DEFAULT_STOPLIST with the CTX_DDL package, you must re-create your index for the changes to take effect.

СПИСОК СТОПОДА по умолчанию:

a he out up
be more their at
had one  will  from
it than and is
only when corp not
she also in  says
was by ms to
about her  over  
because  most  there  
has or  with  
its that are  
of which could  
some an inc  
we can mz  
after  his s  
been mr they  
have other  would  
last the as  
on who for  
such any into  
were co  no  
all if so  
but mrs this

ОБНОВЛЕНИЕ - Хороший белый документ от Oracle, который включает в себя, как можно загрузить полное текстовое поиск из: http://www.oracle.com/technology/products/text/pdf/text_techwp.pdf. Анкет Они упоминают стоп -слова и тот факт, что есть список по умолчанию, но не упоминают сами слова.

Другие советы

Дополнительные ответы:

SELECT *
FROM DR$STOPWORD
LEFT JOIN DR$STOPLIST ON DR$STOPWORD.SPW_SPL_ID = DR$STOPLIST.SPL_ID

В результатах SPL_* поля поступают из DR$STOPLIST системная таблица и SPW_* Поля из DR$STOPWORD стол

  • Из пользовательской схемы, пользовательские ограниченные списки и остановки могут быть извлечены через
SELECT * FROM CTX_USER_STOPLISTS;
SELECT * FROM CTX_USER_STOPWORDS;

Ключевые слова зарезервированы:http://www.toadworld.com/knowledge/knowledgexpertfororacle/tabid/648/topicid/sql15/default.aspxНажмите на «Ключевое слово зарезервированное слова» слева.

«Только» находится в списке.

Я не уверен, что происходит в вашем случае, но я не могу представить, что Oracle не будет поддерживать слово только в полном текстовом поиске. Во многих полных текстовых случаях вы должны искать одно слово. Может ли это быть проблемой, с которой вы сталкиваетесь?

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top