Вопрос

У рубиновых людей есть Хорек.Кто-нибудь знает о какой-либо подобной инициативе для Python?В настоящее время мы используем PyLucene, но я хотел бы изучить возможность перехода на поиск на чистом Python.

Это было полезно?

Решение

Свист — это новый проект, похожий на Lucene, но являющийся чистым Python.

Другие советы

Единственное известное мне решение для поиска на чистом Python (без использования даже расширения C) - это ядерный.Он медленный (намного медленнее, чем PyLucene) и пока нестабильный.

Мы перешли от домашнего поиска и индексирования на базе PyLucene к Солр но ЮММВ.

Я недавно нашел Пиндекстер.Он предоставляет абстрактный интерфейс для различных серверных полнотекстовых поисковых систем/индексаторов.И он поставляется с реализацией на чистом Python по умолчанию.

Однако в Python эти вещи могут быть катастрофически медленными.

Для некоторых приложений чистый Python переоценен.Взгляните на Xapian.

лупи был портом Lucene на чистый Python.Лупи люди предлагают вам использовать PyLucene.Извини.Возможно, вы можете использовать исходники Java в сочетании с Джитон.

+1 к ответам Xapian и Pyndexter.

На самом деле Ferret написан на C с привязками Ruby сверху.Поисковая система на чистом Ruby будет даже медленнее, чем на чистом Python.Мне бы хотелось, чтобы «кто-то другой» написал слой Cython/Pyrex для интерфейса Python для Ferret, но сам не буду этого делать, потому что зачем беспокоиться, если есть привязки Python для Xapian.

Для нечистого Python, Поиск Сфинкса с Python API работает быстрее всего.Судя по тестам из нескольких блогов, Sphinx Search намного быстрее, чем Lucene, использует гораздо меньше памяти и написан на C.

Я разрабатываю на его основе многодокументную поисковую систему, используя Python и веб2py как каркас.

После нескольких недель поиска я нашел хорошее решение на Python: repoze.каталог.Это не строго Python, потому что он использует ZODB для хранения, но мне кажется, что это лучшая зависимость, чем что-то вроде SOLR.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top