Pregunta

Deseo recuperar la fuente de una página web, que se genera de forma dinámica cuando se hace clic en un enlace. El enlace en sí es de la siguiente manera:

<a onclick="function(); return false" href="#">Link</a>

Esto me impide consultar directamente para una dirección URL que me permitiera obtener el sitio web generado dinámicamente (urllib / 2).

¿Cómo se podría recuperar la fuente de la página web, que se generó con la función anterior (en HTML) a través de Python? ¿Hay un método para evitar el return false" href="#"? O el onclick por completo, y obtener la URL real?

Si hay otra forma de generar la página web desde el enlace de arriba abstracta, por lo que uno puede obtener de urllib en Python, por favor referirse a él.


EDIT:

Me generalizó el código que ve arriba - sin embargo me han dicho que hay que aplicar ingeniería inversa al específicas JavaScript para poder utilizarlo

.

Enlace a Js - http://a.quizlet.com/j/ Inglés / create_setku80j8.js

Enlace al sitio con enlace:

<a onclick="importText(); return false" href="#">Bulk-import data</a>

URL real del sitio: http://quizlet.com/create_set/

Beautified JS de Js pertinentes anteriores: http://pastie.org/737042

¿Fue útil?

Solución

No veo de inmediato cualquier contenido generación o un eslabón de código siguiente en el guión; todo lo hace importText es alternar si unos divs se muestran.

Si quieres estudiar las llamadas de la aplicación web hace que hacer una acción en particular, con el fin de reproducirlos desde un bot, es probable que el mejor fuera mirando las peticiones HTTP (envíos de formularios y llamadas AJAX) que el navegador hace durante la realización de dicha acción. Puede utilizar el panel de ‘red’ de Firebug para estudiar esto para Firefox o Fiddler para IE.

Otros consejos

Es probable que tenga que alterar el diseño del Javascript para averiguar lo que está pasando.

¿Puede proporcionar el sitio y el enlace en cuestión?

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top