Recupere a fonte de um site dinâmico usando Python (ignorando o OnClick)
-
18-09-2019 - |
Pergunta
Desejo recuperar a fonte de um site, que é gerado dinamicamente ao clicar em um link. O link em si está como abaixo:
<a onclick="function(); return false" href="#">Link</a>
Isso me impede de consultar diretamente um URL que me permitiria obter o site gerado dinamicamente (urllib/2).
Como se recuperaria a fonte do site, que foi gerada com a função acima (em HTML) via Python? Existe um método para ignorar o return false" href="#"
? Ou o onclick
inteiramente, e obter o URL real?
Se houver outra maneira de gerar o site a partir do link abstrato acima, para que se possa obtê -lo do Urllib em Python, consulte -me.
EDITAR:
Eu generalizei o código visto acima - no entanto, me disseram que é preciso engenheiro reverso o JavaScript específico para poder usá -lo.
Link para .js - http://a.quizlet.com/j/english/create_setku80j8.js
Link para o site com link:
<a onclick="importText(); return false" href="#">Bulk-import data</a>
URL real do site: http://quizlet.com/create_set/
JS embelezado de .js relevantes acima: http://pastie.org/737042
Solução
Não vejo imediatamente nenhum código de geração de conteúdo ou links nesse script; tudo importText
O faz é alternar se algumas divs são mostradas.
Se você deseja estudar as chamadas que o WebApp faz para executar uma ação específica, a fim de reproduzi -las de um bot, provavelmente é melhor olhar para as solicitações HTTP (envios de formulários e chamadas de Ajax) que o navegador faz ao executar ação. Você pode usar o painel 'Net' da Firebug para estudá -lo para o Firefox, ou Fiddler para o IE.
Outras dicas
Você provavelmente terá que reverter o engenheiro do JavaScript para descobrir o que está acontecendo.
Você pode fornecer o site e o link em questão?