Вопрос

Я смотрю на создание полной поисковой системы для одного из моих проектов. У нас есть MySQL, Tokyo Tyran и файловые документы, которые необходимо индексировать.

Я сейчас смотрю на SPHINX, но не могу понять, могу ли я использовать его для индексации каждого документа.

Я знаю, что можно позволить Sphinx использовать MySQL, но я смотрю на способ позволить индексу Sphinx и запросить Tokyo Tyrant, а также индексные документы.

Это может быть сфинкс, Xapian или другой, но нет Java (Lucene отсутствует), но что -то, что можно использовать с PHP и работать на Linux.

Есть ли идеи поисковой системы, которая может принять больше, чем MySQL в качестве источника?

Спасибо

Это было полезно?

Решение

Вы можете отправлять данные из любого источника в Sphinx, используя xmlpipe2

Вам просто нужно написать какой -то код (вероятно, в PHP), чтобы прочитать из Tokyo Tyrant (не уверен, что это так, чтобы вы там самостоятельно), а также файловую систему и упаковывать все это XML. Затем вы просто настроили свой источник Sphinx для запуска команды, которая выполняет ваш пользовательский код, и Sphinx позаботится об остальном.

Другие советы

Если у вас не так много документов, и вы хотите использовать только PHP, вы должны взглянуть на Zend_Search_Lucene :

Zend_search_lucene-это поисковая система общего назначения, полностью написанная в PHP 5. Поскольку она хранит свой индекс в файловой системе и не требует сервера базы данных, она может добавить возможности поиска практически на любой веб-сайт PHP.

Тем не менее, если вы используете свой собственный сервер, вы, вероятно, можете установить программное обеспечение, что означает, что вы можете развернуть Lucence/Solr Sphinx, даже если они не записаны только в PHP-это может быть на самом деле более безопасное решение, если вам нужно Индексировать много контента.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top