Вопрос

Я изучал поиск плагинов / драгоценных камней для Rails.В большинстве статей хорек (Lucene) сравнивается с Ultrasphinx или, возможно, с Думающим сфинксом, но ни в одной из них не говорится о Поисковая логика.У кого-нибудь есть какие-нибудь подсказки относительно того, с чем это можно сравнить?Что вы используете и как это работает?

Это было полезно?

Решение

  • thinking_sphinx и sphinx прекрасно работают, никаких проблем с индексацией, запросами, установкой никогда (5 или 6 установок, включая производственный slicehost)

  • почему все не используют sphinx, скажем, craigslist?читайте здесь о его ограничениях (статьи полуторагодичной давности.Разработчик sphinx, Аксенофф, работает над этим, и он внедряет новые функции, повышает надежность и устраняет ошибки с поразительной скоростью)

http://codemonkey .ravelry.com/2008/01/09/sphinx-for-search/

http://www.ibm.com/developerworks/opensource/library/os-php-apachesolr/

Сравнение полнотекстовых поисковых систем - Lucene, Sphinx, Postgresql, MySQL?

  • хорек:простая установка, не работает должным образом, очень медленная индексация (одна база данных mysql:сфинкс:3 секунды, хорек:50 минут).Хорошо документированные проблемы (повреждение индекса) на drb-серверах в рабочей среде под нагрузкой.Сказав это, я использую его в develometn с тех пор, как acts-as_ferret вышел 3 года назад, и он сослужил мне хорошую службу.Отказ от использования основы Портера является преимуществом в некоторых контекстах.

  • Lucene и Solr - чемпионы gorilla / mack truck / в тяжелом весе по поиску с открытым исходным кодом.Команды разрабатывают впечатляющее количество новых функций в выпуск solr 14:

  • действует как решение:работает хорошо, когда "томкэт" или причал установлены, но иногда это доставляет неудобства.Тот Самый Вилка A-A-S от mattmatt является основным форком, но проект относительно не поддерживается.

  • повторите установку tomcat:SOLR / lucene, несомненно, обладает лучшей поисковой системой базы знаний / поддержки из всех программных пакетов, которые я видел (думаю, я не так уж удивлен), окно поиска здесь:

http://www.lucidimagination.com/

  • Солнечное пятно нового оболочка ruby, построенная на solr-ruby.Выглядит многообещающе, но я не смог установить его на OSX.Индексирует все объекты ruby, а не только базы данных с помощью AR

  • одна вещь, которая действительно поучительна, - это установить 2 поисковых плагина, напримерсфинкс и СОЛР, сфинкс и хорек, и посмотрите, какие разные результаты они дают.Это так же просто, как @sphinx_results - @ferret_results


только что увидел этот пост и ответы на него

http://zooie.wordpress.com/2009/07/06/a-comparison-of-open-source-search-engines-and-indexing-twitter/

http://www.jroller.com/otis/entry/open_source_search_engine_benchmark

http://www.flax.co.uk/blog/2009/07/07/xapian-compared/

Другие советы

Во-первых, моя очевидная предвзятость:Я создал и поддерживаю Thinking Sphinx.

Так получилось, что я действительно видел Бена Джонсона (создателя SearchLogic), который вчера вечером присутствовал на рубиновой встрече в Нью-Йорке.SearchLogic предназначен только для SQL, поэтому, если вы не имеете дело с огромными таблицами и ранжирование по релевантности не требуется, то это может быть именно то, что вам нужно.Синтаксис тоже довольно чистый.

Однако, если вы хотите, чтобы весь анализ запросов обрабатывался чужим кодом, то Sphinx или Solr (я думаю, это Lucene под капотом), вероятно, сработают лучше.

SearchLogic — хороший плагин, но на самом деле он предназначен для того, чтобы сделать ваш поисковый код более читабельным, он не обеспечивает автоматическое индексирование, как Sphinx.Я не использовал Феррета, но Сфинкс невероятно силен.

http://railscasts.com/episodes/120-thinking-sphinx

Отличное введение, чтобы увидеть, насколько это гибко.

Я не использовал SearchLogic, но могу вам сказать, что Lucene — очень зрелый проект, реализованный на многих языках.Он быстрый и гибкий, а с API интересно работать.Это хорошая ставка.

Учитывая, что этот вопрос по-прежнему высоко оценивается в Google для полнотекстового поиска, я бы очень хотел сказать, что Солнечное пятно сегодня еще сильнее, если вы заинтересованы в добавлении возможностей полнотекстового поиска в ваше приложение Rails (и хотели бы, чтобы Solr поддерживал вас в этом).Вы можете проверить полное руководство по этому вопросу здесь.

И пока мы этим занимаемся, на поле появился еще один претендент: ЭластичныйПоиск, которая призвана стать полнотекстовой поисковой системой реального времени, построенной на основе Lucene (но работающей по-другому по сравнению с Solr).ElasticSearch включает в себя готовое сегментирование и репликацию на несколько узлов, более быстрый поиск в реальном времени, «перколяторы», позволяющие вам получать уведомления, когда что-то, соответствующее вашим критериям, становится доступным и развивается очень быстро, а также множество других функций.На его основе легко что-то построить, поскольку API предельно прост и полностью основан на REST с использованием JSON в качестве формата.Можно сказать, что для его использования даже не нужен плагин.

Лично я не заморачиваюсь с агностикой баз данных для веб-приложений и вполне доволен полнотекстовым поиском в pg83.Преимущество в том, что если и когда вы измените свою структуру/язык, у вас все равно будет полнотекстовый поиск.

Для тех, кто ищет простой поиск без каких-либо зависимостей, посмотрите act_as_indexed

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top