我想检索网站的源,即动态地在点击一个链接生成。链接本身是如下:

<a onclick="function(); return false" href="#">Link</a>

此阻止我直接查询,让我得到动态生成的网页(的urllib / 2)的URL。

一个如何将检索的网站,将其用蟒经由上述功能(在HTML)产生的源极?有没有办法绕过return false" href="#"的方法?或onclick完全,并得到实际的URL?

如果有另一种方式来生成从上面的抽象链接的网站,使人们可以在Python从urllib的得到它,请参阅我给它。


修改

我全身看到上面的代码 - 但是我已经告诉人们必须逆向工程的具体javascript才能够使用它。

链接到的.js - http://a.quizlet.com/j/英语/ create_setku80j8.js

链接到的网站与链接:

<a onclick="importText(); return false" href="#">Bulk-import data</a>

位点的实际URL: http://quizlet.com/create_set/

以上相关的.js的美化JS: http://pastie.org/737042

有帮助吗?

解决方案

我不立即看到任何内容代或链接跟随在该脚本代码;所有importText确实是切换是否显示几个的div。

如果你想学习web应用使得做一个特定的号召,为了从一个机器人再现出来,你可能是最好的就要去查看HTTP请求(表单提交和AJAX调用),浏览器,使而执行该操作。你可以使用Firebug的“网络”面板来研究这种针对Firefox,或为提琴手IE。

其他提示

您可能不得不反向工程的JavaScript制定出正在发生的事情。

您可以提供的网站,有问题的链接?

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top