Pergunta

Desejo recuperar a fonte de um site, que é gerado dinamicamente ao clicar em um link. O link em si está como abaixo:

<a onclick="function(); return false" href="#">Link</a>

Isso me impede de consultar diretamente um URL que me permitiria obter o site gerado dinamicamente (urllib/2).

Como se recuperaria a fonte do site, que foi gerada com a função acima (em HTML) via Python? Existe um método para ignorar o return false" href="#"? Ou o onclick inteiramente, e obter o URL real?

Se houver outra maneira de gerar o site a partir do link abstrato acima, para que se possa obtê -lo do Urllib em Python, consulte -me.


EDITAR:

Eu generalizei o código visto acima - no entanto, me disseram que é preciso engenheiro reverso o JavaScript específico para poder usá -lo.

Link para .js - http://a.quizlet.com/j/english/create_setku80j8.js

Link para o site com link:

<a onclick="importText(); return false" href="#">Bulk-import data</a>

URL real do site: http://quizlet.com/create_set/

JS embelezado de .js relevantes acima: http://pastie.org/737042

Foi útil?

Solução

Não vejo imediatamente nenhum código de geração de conteúdo ou links nesse script; tudo importText O faz é alternar se algumas divs são mostradas.

Se você deseja estudar as chamadas que o WebApp faz para executar uma ação específica, a fim de reproduzi -las de um bot, provavelmente é melhor olhar para as solicitações HTTP (envios de formulários e chamadas de Ajax) que o navegador faz ao executar ação. Você pode usar o painel 'Net' da Firebug para estudá -lo para o Firefox, ou Fiddler para o IE.

Outras dicas

Você provavelmente terá que reverter o engenheiro do JavaScript para descobrir o que está acontecendo.

Você pode fornecer o site e o link em questão?

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top