Pergunta

A partir do tutorial Scrapy:

domain_name: identifica a aranha. Ele deve ser exclusivo, ou seja, não é possível definir o mesmo nome de domínio para diferentes Spiders.

Isso significa que domain_name deve ser um nome de domínio válido, como

domain_name = 'example.com'

Ou posso citar

domain_name = 'ex1'

O problema é que eu tinha uma aranha que trabalhou com nome de domínio

domain_name = 'whitecase.com'

Agora, eu criei uma nova aranha como uma instância de CrawlSpider e nomeou-

domain_name = 'wc2'

mas estou recebendo o "could not find spider for domain "wc2"" erro

Foi útil?

Solução

Para responder a minha própria pergunta:

domain_name = 'WC2'

obras.

Outras dicas

Como você descobriu-se, domain_name não deve ser real. É usado ao chamar a aranha para rastreamento.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top