domain_name scrapy para aranha
Pergunta
A partir do tutorial Scrapy:
domain_name: identifica a aranha. Ele deve ser exclusivo, ou seja, não é possível definir o mesmo nome de domínio para diferentes Spiders.
Isso significa que domain_name
deve ser um nome de domínio válido, como
domain_name = 'example.com'
Ou posso citar
domain_name = 'ex1'
O problema é que eu tinha uma aranha que trabalhou com nome de domínio
domain_name = 'whitecase.com'
Agora, eu criei uma nova aranha como uma instância de CrawlSpider e nomeou-
domain_name = 'wc2'
mas estou recebendo o "could not find spider for domain "wc2""
erro
Solução
Para responder a minha própria pergunta:
domain_name = 'WC2'
obras.
Outras dicas
Como você descobriu-se, domain_name
não deve ser real. É usado ao chamar a aranha para rastreamento.
Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow