Scrapy nom_domaine pour spider
Question
À partir du tutoriel Scrapy:
nom_domaine: identifie l'araignée. Il doit être unique, c'est-à-dire que vous ne pouvez pas définir le même nom de domaine pour différents araignées.
Est-ce que cela signifie que nom_domaine
doit être un nom de domaine valide, tel que
nom_domaine = 'exemple.com'
Ou puis-je nommer
domain_name = 'ex1'
Le problème est que j'avais une araignée qui fonctionnait avec un nom de domaine
domain_name = 'whitecase.com'
Maintenant, j'ai créé un nouveau spider en tant qu'instance de CrawlSpider et je l'ai nommé
domain_name = 'wc2'
mais je reçois le message d'erreur "Je ne trouve pas l'araignée pour le domaine" wc2 ""
La solution
Pour répondre à ma propre question:
nom_domaine = 'wc2'
fonctionne.
Autres conseils
Comme vous l'avez découvert vous-même, nom_domaine
ne devrait pas être réel. Il est utilisé pour appeler l'araignée à explorer.