Question

Je cherche à créer un moteur de recherche en texte intégral pour l'un de mes projets. Nous avons un MySQL, Tokyo Tyrant et des documents de fichiers qui doivent être indexés.

Je regarde Sphinx en ce moment, mais je ne peux pas comprendre si je peux l'utiliser pour indexer chaque document.

Je sais qu'il est possible de laisser Sphinx utiliser MySQL, mais je cherche un moyen de laisser Sphinx Index et interroger Tokyo Tyran ainsi que des documents de fichiers d'index.

Il pourrait s'agir de Sphinx ou Xapian ou un autre mais pas de java (Lucene est sorti) mais quelque chose qui peut être utilisé avec PHP et fonctionner sur Linux.

Une idée d'un moteur de recherche qui peut accepter davantage que MySQL comme source?

Merci

Était-ce utile?

La solution

Vous pouvez envoyer des données de n'importe quelle source à Sphinx en utilisant le xmlpipe2

Vous auriez juste besoin d'écrire du code (probablement en PHP) pour lire à partir de Tokyo Tyrant (je ne sais pas ce que c'est pour que vous soyez seul) et le système de fichiers et l'emballage en tant que XML. Ensuite, il vous suffit de configurer votre source Sphinx pour exécuter une commande qui exécute votre code personnalisé et Sphinx s'occupe du reste.

Autres conseils

Si vous n'avez pas trop de documents et que vous souhaitez utiliser uniquement PHP, vous devriez jeter un œil à Zend_Search_Lucene :

Zend_Search_lucene est un moteur de recherche de texte à usage général entièrement écrit dans PHP 5. Puisqu'il stocke son index sur le système de fichiers et ne nécessite pas de serveur de base de données, il peut ajouter des capacités de recherche à presque n'importe quel site Web axé sur PHP.

Pourtant, si vous utilisez votre propre serveur, vous pouvez probablement installer un logiciel, ce qui signifie que vous pouvez déployer Lucence / Solr de Sphinx, même s'ils ne sont pas écrits dans unique indexez beaucoup de contenu.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top