Question

J'ai eu un coup d'œil à de nombreux tutoriels concernant cookiejar, mais mon problème est que la page Web que je veux scape crée le cookie en utilisant javascript et je ne peux pas sembler récupérer le cookie. Quelqu'un at-il une solution à ce problème?

Était-ce utile?

La solution

Si toutes les pages ont la même JavaScript alors vous pourriez peut-être analyser le code HTML pour trouver ce morceau de code, et de cette obtenir la valeur du cookie serait réglé sur?

Cela rendrait votre grattage très vulnérables aux changements du site tiers, mais ce qui est le plus souvent le cas en raclant. (S'il vous plaît garder à l'esprit que le propriétaire du site Web tiers peut ne pas aimer que vous obtenez le contenu de cette façon.)

Autres conseils

Je répondais à votre autre question ainsi: jeter un oeil à mécaniser . Il est probablement le module de grattage les plus en fonctionnalités que je sais. Si le cookie est envoyé, alors je suis sûr que vous pouvez obtenir avec ce module

Peut-être que vous pouvez exécuter le code JavaScript dans un moteur JavaScript avec des liaisons Python (comme python -spidermonkey ou pyv8 ) puis récupérer le cookie. Ou, comme le code javascript est exécuté côté client de toute façon, vous pouvez être en mesure de convertir le code de génération de cookie à Python.

Vous pouvez accéder à la page en utilisant un vrai navigateur, via Pamie , win32com ou similaire, le JavaScript est en cours d'exécution dans son environnement natif.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top