Frage

Ich möchte die Quelle einer Webseite abzurufen, wird das dynamisch generierte auf einen Link klicken. Die Verbindung selbst ist wie folgt:

<a onclick="function(); return false" href="#">Link</a>

Das hält es von direkt für eine URL Abfrage, die mir die dynamisch generierte Website (urllib / 2) zu erhalten erlauben würde.

Wie würde man die Quelle der Webseite abgerufen wird, die mit der obigen Funktion erzeugt wurden (in HTML) über Python? Gibt es eine Methode, um die return false" href="#" zu umgehen? Oder die onclick vollständig, und die tatsächliche URL bekommen?

Wenn es eine andere Möglichkeit ist die Website von dem abstrakten Link oben zu erzeugen, so dass man es von urllib in Python bekommen kann, finden Sie mich es.


EDIT:

I verallgemeinert den Code oben gesehen - aber ich habe gesagt, dass man die spezifischen Javascript Reverse hat Ingenieur es in der Lage sein zu verwenden,

.

Link zur Js - http://a.quizlet.com/j/ Englisch / create_setku80j8.js

Link zur Website mit Link:

<a onclick="importText(); return false" href="#">Bulk-import data</a>

Die tatsächliche URL der Website: http://quizlet.com/create_set/

verschönert JS relevanten Js oben: http://pastie.org/737042

War es hilfreich?

Lösung

Ich sehe nicht sofort alle Inhalte Generation oder Link-folgenden Code in dem Skript; tut alles importText ist Knebel, ob ein paar divs gezeigt.

Wenn Sie die Anrufe der Webapp macht studieren wollen, eine bestimmte Aktion zu tun, um sie von einem Bot zu reproduzieren, sind Sie wahrscheinlich am besten dran an den HTTP-Anfragen suchen (Formularübermittlungen und AJAX-Aufrufe), dass der Browser macht während dieser Aktion durchgeführt wird. Sie können Firebug ‚Net‘ Panel zu studieren dies für Firefox oder Fiddler für IE verwenden.

Andere Tipps

Sie werden wahrscheinlich die JavaScript zu umkehren haben Ingenieur, herauszufinden, was los ist.

Können Sie die Website und den Link in Frage geben?

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top