Pregunta

He estado mirando en busca plugins / gemas para los carriles. La mayoría de los artículos comparar Hurón (Lucene) a UltraSphinx o posiblemente Pensando Sphinx, pero ninguno que hablar de SearchLogic . ¿Alguien tiene alguna pista sobre cómo se compara ese? ¿Qué se usa, y cómo se realiza?

¿Fue útil?

Solución

  • thinking_sphinx y el trabajo esfinge muy bien, sin indexación, consulta, instale problemas siempre (5 o 6 instalación, incluyendo la producción slicehost)

  • ¿por qué no todo el mundo utiliza esfinge, como, por ejemplo craigslist? leer aquí acerca de sus limitaciones (año y medio viejos artículos. El desarrollador esfinge, Aksyonoff, está trabajando en estos y que está poniendo en las características y la fiabilidad y la estampación a cabo errores a un ritmo increíble)

http://codemonkey.ravelry.com/2008/ 01/09 / esfinge para la búsqueda /

http://www.ibm.com/developerworks/ opensource / library / os-php-apachesolr /

Comparación de la plena texto motor de búsqueda - Lucene, Sphinx, PostgreSQL, MySQL

  • hurón: fácil de instalar, no se origina adecuadamente, indexación muy lento (una base de datos mysql: Sphinx: 3 segundos, hurón: 50 minutos). problemas bien documentados (índice de corrupción) en los servidores de DRB en la producción bajo carga. Una vez dicho esto, tengo que usarlo en develometn desde actos-as_ferret salió hace 3 años, y me ha servido bien. No adherirse a porter derivada es una ventaja en algunos contextos.

  • Lucene y Solr es el gorila / Mack Truck champ / peso pesado de búsqueda de código abierto. Los equipos han estado haciendo un número impresionante de nuevas características en Solr 14 de liberación:

  • actúa-como-Solr: funciona bien, una vez que el Tomcat o Jetty es en su lugar, pero los que son a veces un dolor. El AAS tenedor por mattmatt es el principal tenedor, pero el proyecto es relativamente sin mantenimiento.

  • re el gato instalar: SOLR / Lucene tiene, sin duda, el mejor motor de búsqueda en la base de conocimiento / apoyo de cualquier paquete de software que he visto (que supongo que no soy tan sorprendido), el cuadro de selección:

http://www.lucidimagination.com/

  • de manchas solares del nuevo envoltorio rubí, construir sobre Solr-rubí. Parece prometedor, pero no pude conseguir que se instale en OSX. Índices de todos los objetos de rubí, no sólo las bases de datos a través de AR

  • una cosa que es muy instructiva es instalar 2 plugins de búsqueda, por ejemplo Esfinge y SOLR, esfinge y hurón, y ver lo que diferentes resultados regresan. Es tan fácil como @sphinx_results - @ferret_results


acabo de ver este post y respuestas

http://zooie.wordpress.com/2009/07/06/a-comparison-of-open-source-search-engines-and-indexing-twitter/

http://www.jroller.com/otis/entry/open_source_search_engine_benchmark

http://www.flax.co. uk / blog / 2009/07/07 /-xapian comparación /

Otros consejos

En primer lugar, mi sesgo evidente:. He creado y mantener Pensando Sphinx

Como se da la circunstancia, realmente vi Ben Johnson (creador de SearchLogic) presente en la ciudad de Nueva York rubí satisfacer al respecto anoche. SearchLogic es SQL de sólo - por lo que si usted no está tratando con mesas grandes, y no son necesarios ranking de relevancia, entonces podría ser exactamente lo que estás buscando. La sintaxis es bastante limpio, también.

Sin embargo, si desea que toda la inteligencia consulta a cargo de código que no es el suyo, a continuación, Sphinx o Solr (que es Lucene bajo el capó, creo) es probablemente va a funcionar mejor.

SearchLogic es un buen complemento, pero sirve realmente para hacer que su código de búsqueda más fácil de leer, que no proporciona la indexación automática que hace Esfinge. No he utilizado Ferret, pero Sphinx es increíblemente poderoso.

http://railscasts.com/episodes/120-thinking-sphinx

Una gran introducción a ver lo flexible que es.

No he utilizado SearchLogic pero yo puedo decir que Lucene es un proyecto muy maduro, que tiene aplicación en muchos idiomas. Es rápido y flexible y la API es divertido trabajar con él. Es una buena apuesta.

Teniendo en cuenta esta cuestión sigue siendo altamente clasificado en Google para la búsqueda de texto completo, realmente me gustaría decir que de manchas solares es aún más fuerte hoy en día si usted está interesado en la adición de capacidades de búsqueda de texto completo a su uso rieles (y le gustaría tener Solr detrás de usted para eso). Puede comprobar un tutorial completo sobre esta aquí .

Y ya que estamos en ello, otro contendiente que ha llegado en el campo es Elasticsearch , que los objetivos ser un motor de búsqueda de texto completo en tiempo real construida en la cima de Lucene (pero hacer las cosas de manera diferente si se compara con Solr). Elasticsearch incluye sharding y replicación fuera de la caja a varios nodos, más rápido de búsqueda en tiempo real "percoladores" que permitirá recibir notificaciones cuando algo que coincide con los criterios que se disponga y se está moviendo muy rápido con muchas otras características más. Es fácil de construir algo en la parte superior de la misma, ya que la API está muerto simple y completamente basado en REST utilizando JSON como formato. Se podría decir que ni siquiera necesita un plugin para utilizarlo.

En lo personal, no me molesto con los agnósticos base de datos para aplicaciones web y estoy bastante contento con la búsqueda de texto completo en pg83. El beneficio es, siempre y cuando cambie su marco / idioma, que todavía tendrá que buscar con texto completo.

Para todos aquellos que buscan un simple joya de búsqueda sin ningún tipo de dependencias, echa un vistazo a acts_as_indexed

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top