Вопрос

Из руководства по Scrapy:

домен_имя:идентифицирует Паука.Оно должно быть уникальным, то есть вы не можете установить одно и то же доменное имя для разных Spiders.

Означает ли это , что domain_name должно быть действительное доменное имя, например

домен_имя = 'example.com'

Или я могу назвать

domain_name = 'ex1'

Проблема в том, что у меня был паук, который работал с доменным именем

domain_name = 'whitecase.com'

Теперь я создал новый spider как экземпляр CrawlSpider и назвал его

domain_name = 'wc2'

но я получаю сообщение об ошибке "could not find spider for domain "wc2""

Это было полезно?

Решение

Чтобы ответить на мой собственный вопрос:

имя_домена = 'wc2'

работает.

Другие советы

Как вы сами узнали, имя_домена не должно быть реальным. Он используется при вызове паука для сканирования.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top