Frage

Ich habe Spinnen, die ich mit dem Scrapy -Framework geschrieben habe. Ich habe Probleme, irgendwelche Pipelines zum Laufen zu bringen. Ich habe den folgenden Code in meiner Pipelines.py:

class FilePipeline(object):

    def __init__(self):
        self.file = open('items.txt', 'wb')

    def process_item(self, item, spider):
        line = item['title'] + '\n'
        self.file.write(line)
        return item

Und meine CrawlSpider -Unterklasse hat diese Linie, um die Pipeline für diese Klasse zu aktivieren.

ITEM_PIPELINES = [
        'event.pipelines.FilePipeline'
    ]

Allerdings, wenn ich es verwendete

scrapy crawl my_spider

Ich bekomme eine Zeile, die sagt

2010-11-03 20:24:06+0000 [scrapy] DEBUG: Enabled item pipelines:

Ohne Pipelines (ich nehme an, hier sollte die Protokollierung sie ausgeben).

Ich habe versucht, die Dokumentation durchzuschauen, aber es scheint keine vollständigen Beispiele für ein ganzes Projekt zu geben, um zu sehen, ob ich etwas verpasst habe.

Irgendwelche Vorschläge, was als nächstes versuchen soll? Oder wo Sie nach weiteren Dokumentation suchen?

War es hilfreich?

Lösung

Ich habs! Die Linie muss im Einstellungsmodul für das Projekt eingehen. Jetzt gehts!

Andere Tipps

Ich bin bereit zu wetten, dass es irgendwo ein Kapitalisierungsunterschied in der Wortpipeline ist:

Pipeline vs. Pipeline

ich bemerke 'event.pipelines.FilePipeline' Verwendet das erstere, während Ihr Code das letztere verwendet: Welche verwenden Ihre Dateinamen?

(Ich bin oft Opfer dieses Rechtschreibfehlers geworden!)

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top