Domanda

Ho dato un'occhiata a molti tutorial per quanto riguarda Cookiejar, ma il mio problema è che la pagina web che voglio scape crea il cookie utilizzando JavaScript e io non riesco a recuperare il cookie. Qualcuno ha una soluzione a questo problema?

È stato utile?

Soluzione

Se tutte le pagine hanno lo stesso JavaScript allora forse si potrebbe analizzare il codice HTML per trovare quel pezzo di codice, e da quel ottenere il valore del cookie verrebbe impostato?

Ciò renderebbe il vostro raschiando molto vulnerabili ai cambiamenti del sito web di terze parti, ma questo è il caso più frequente, mentre raschiando. (Si prega di tenere presente che il proprietario del sito di terze parti non può, come quella che stai ricevendo il contenuto di questo modo.)

Altri suggerimenti

Ho risposto alla tua altra domanda così: dare un'occhiata a Mechanize . E 'probabilmente il modulo raschiando più completamente descritto lo so:. Se il cookie viene inviato, quindi sono sicuro che si può ottenere ad esso con questo modulo

Forse è possibile eseguire il codice JavaScript in un motore JavaScript con binding Python (come pitone -spidermonkey o pyv8 ) e quindi recuperare il cookie. O, come il codice JavaScript viene eseguito lato client in ogni caso, si può essere in grado di convertire il codice biscotto generatrici di Python.

Si potrebbe accedere alla pagina utilizzando un vero browser, tramite PAMIE , win32com o simili, allora il JavaScript sarà in esecuzione nel suo ambiente nativo.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top