Domanda

I ruby ??hanno Furetto . Qualcuno conosce un'iniziativa simile per Python? Attualmente stiamo usando PyLucene, ma mi piacerebbe indagare sul passaggio alla pura ricerca in Python.

È stato utile?

Soluzione

Whoosh è un nuovo progetto che è simile a lucene, ma è puro pitone.

Altri suggerimenti

L'unica soluzione di ricerca pure-python (che non comprende nemmeno l'estensione C) che conosco è Nucular . È lento (molto più lento di PyLucene) e ancora instabile.

Siamo passati dalla ricerca e dall'indicizzazione casalinga basata su PyLucene a Solr ma YMMV.

Di recente ho trovato pyndexter . Fornisce un'interfaccia astratta a vari motori di ricerca / indicizzatori full-text back-end. E viene fornito con un'implementazione di pure-python predefinita.

Queste cose possono essere disastrosamente lente anche se in Python.

Per alcune applicazioni Python puro è sopravvalutato. Dai un'occhiata a Xapian.

lupy era una porta lucene per puro pitone. Le persone del lupy suggeriscono che usi PyLucene . Scusate. Forse puoi usare le fonti Java in combinazione con Jython .

+1 alle risposte di Xapian e Pyndexter.

Il furetto è in realtà scritto in C con i collegamenti Ruby in cima. Un puro motore di ricerca Ruby sarebbe persino più lento di un puro Python. Mi piacerebbe vedere " qualcun altro " scrivere un livello Cython / Pyrex per l'interfaccia Python su Ferret, ma non lo farò da solo perché perché preoccuparsi quando ci sono collegamenti Python per Xapian.

Per Python non puro, Ricerca Sfinge con l'API Python funziona più velocemente. Dai benchmark di più blog, Sphinx Search è molto più veloce di Lucene, usa molta meno memoria ed è in C.

Sto sviluppando un motore di ricerca multi-documento basato su di esso, usando Python e web2py come framework.

Dopo settimane di ricerca, ho trovato una bella soluzione Python: repoze.catalog . Non è strettamente solo Python perché utilizza ZODB per l'archiviazione, ma mi sembra una dipendenza migliore rispetto a qualcosa come SOLR.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top