Frage

Ich habe mir viele Tutorials in Bezug auf Cookiejar angesehen, aber mein Problem ist, dass die Webseite, die ich senken möchte, das Cookie mit JavaScript erstellt und ich den Cookie nicht abrufen kann. Hat jemand eine Lösung für dieses Problem?

War es hilfreich?

Lösung

Wenn alle Seiten das gleiche JavaScript haben, könnten Sie vielleicht die HTML analysieren, um diesen Code zu finden, und daraus den Wert erhalten, auf den der Cookie eingestellt wäre?

Das würde Ihr Kratzen für Änderungen auf der Website von Drittanbietern sehr anfällig machen, aber das ist am häufigsten beim Scraping der Fall. (Bitte beachten Sie, dass der Besitzer von Drittanbietern möglicherweise nicht gefällt, dass Sie den Inhalt auf diese Weise erhalten.)

Andere Tipps

Ich habe auf deine geantwortet andere Frage auch: Schauen Sie sich einen Blick auf mechanisieren. Es ist wahrscheinlich das am besten vorgestellte Scraping -Modul, das ich kenne: Wenn das Cookie gesendet wird, bin ich sicher, dass Sie mit diesem Modul dazu kommen können.

Vielleicht können Sie den JavaScript -Code in einer JavaScript -Engine mit Python -Bindungen ausführen (wie wie Python-Spidermonkey oder PYV8) und dann den Keks abrufen. Oder wie der JavaScript-Code ohnehin Client-Seite ausgeführt wird, können Sie den Cookie-generierenden Code möglicherweise in Python konvertieren.

Sie können über einen echten Browser über die Seite zugreifen Pamie, Win32com Oder ähnlich, dann wird das JavaScript in seiner nativen Umgebung ausgeführt.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top