Ich kann keine Scrapy -Pipeline zum Laufen bringen
-
28-09-2019 - |
Frage
Ich habe Spinnen, die ich mit dem Scrapy -Framework geschrieben habe. Ich habe Probleme, irgendwelche Pipelines zum Laufen zu bringen. Ich habe den folgenden Code in meiner Pipelines.py:
class FilePipeline(object):
def __init__(self):
self.file = open('items.txt', 'wb')
def process_item(self, item, spider):
line = item['title'] + '\n'
self.file.write(line)
return item
Und meine CrawlSpider -Unterklasse hat diese Linie, um die Pipeline für diese Klasse zu aktivieren.
ITEM_PIPELINES = [
'event.pipelines.FilePipeline'
]
Allerdings, wenn ich es verwendete
scrapy crawl my_spider
Ich bekomme eine Zeile, die sagt
2010-11-03 20:24:06+0000 [scrapy] DEBUG: Enabled item pipelines:
Ohne Pipelines (ich nehme an, hier sollte die Protokollierung sie ausgeben).
Ich habe versucht, die Dokumentation durchzuschauen, aber es scheint keine vollständigen Beispiele für ein ganzes Projekt zu geben, um zu sehen, ob ich etwas verpasst habe.
Irgendwelche Vorschläge, was als nächstes versuchen soll? Oder wo Sie nach weiteren Dokumentation suchen?
Lösung
Ich habs! Die Linie muss im Einstellungsmodul für das Projekt eingehen. Jetzt gehts!
Andere Tipps
Ich bin bereit zu wetten, dass es irgendwo ein Kapitalisierungsunterschied in der Wortpipeline ist:
Pipeline vs. Pipeline
ich bemerke 'event.pipelines.FilePipeline'
Verwendet das erstere, während Ihr Code das letztere verwendet: Welche verwenden Ihre Dateinamen?
(Ich bin oft Opfer dieses Rechtschreibfehlers geworden!)