Pergunta

Estou usando o PySolr para executar minha pesquisa.Quero indexar um feed rss e queria saber se isso é possível usando o PySolr e, em caso afirmativo, como fazer isso.

Encontrei instruções sobre como fazer isso no Solr em http://wiki.apache.org/solr/DataImportHandler#HttpDataSource_Example

mas não consigo encontrar nada sobre como fazer o equivalente no PySolr

Obrigado

Foi útil?

Solução

Você provavelmente não precisa fazer o equivalente no PySolr.Se você já tem o Solr indexando o feed, conforme exemplo, basta usar o PySolr para consultar esse índice.Algo como:

from pysolr import Solr
solr = Solr('http://localhost:8983/solr/rss/')
response = solr.search('some query string')
print response.hits
for result in response.docs:
    do_stuff_with(result)

Se você realmente quiser fazer isso do lado do Python, precisará buscar e analisar o RSS lá (usando outras bibliotecas, por exemplo Analisador de feed universal);O PySolr apenas envolve a interação com o Solr, ele não “faz” fontes de dados.

Você pode querer conferir Palheiro, que usa PySolr (e pode usar outros mecanismos) e abstrai perfeitamente o trabalho de criar entradas de índice de pesquisa e enviá-las ao Solr para indexação.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top