Pregunta

Estoy utilizando PySolr ejecutar mi búsqueda. Quiero índice de un canal RSS y se preguntaba si esto es posible usando PySolr y si es así cómo lo haces.

He encontrado instrucciones sobre cómo hacer esto en Solr en http: //wiki.apache .org / Solr / DataImportHandler # HttpDataSource_Example

pero no puede encontrar nada sobre cómo hacer el equivalente en PySolr

Gracias

¿Fue útil?

Solución

Probablemente no es necesario hacer el equivalente en PySolr. Si ya tiene Solr indexación de la alimentación, como en el ejemplo, entonces sólo tiene que utilizar PySolr para consultar ese índice. Algo así como:

from pysolr import Solr
solr = Solr('http://localhost:8983/solr/rss/')
response = solr.search('some query string')
print response.hits
for result in response.docs:
    do_stuff_with(result)

Si realmente quiere hacerlo desde el lado Python, entonces usted tendrá que obtener y analizar el flujo allí (usando otras bibliotecas, por ejemplo, universal RSS Analizador ); PySolr simplemente envuelve la interacción con Solr, que no “hace” fuentes de datos.

Es posible que desee comprobar hacia fuera Haystack , que utiliza PySolr (y puede utilizar otros motores) y pulcramente abstrae la trabajo de crear entradas de índice de búsqueda y embarcarlos a Solr para la indexación.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top