Scrapyの複数のクモ間で訪問したURLを共有しますか?
-
21-12-2019 - |
質問
Scrapydを使用して、同じドメイン間のジョブとして複数のクモを実行しています。私はScrapyを訪問したURLが訪れたURLを持っていました。
で同じクモのインスタンスを作成するとcurl http://localhost:6800/schedule.json -d project=projectname -d spider=spidername.
.
それはむしろ同じURLと重複したデータを削除されています。誰かが前に同様の問題を扱っていますか?
解決
私のアドバイスは、サイトを複数のstart_urls
に分割しようとすることです。それから、 start_urls
のさまざまな値を各クモに渡すことができます。。
所属していません StackOverflow