Python을 사용하여 동적 웹 사이트의 소스 검색 (OnClick를 우회)

https://stackoverflow.com/questions/1879876

18-09-2019
|

문제

링크를 클릭하면 동적으로 생성되는 웹 사이트 소스를 검색하고 싶습니다. 링크 자체는 다음과 같습니다.

<a onclick="function(); return false" href="#">Link</a>

이로 인해 동적으로 생성 된 웹 사이트 (urllib/2)를 얻을 수있는 URL을 직접 쿼리하지 못하게됩니다.

Python을 통해 위의 함수 (HTML)로 생성 된 웹 사이트의 소스를 어떻게 검색합니까? 우회하는 방법이 있습니까? return false" href="#"? 아니면 그 onclick 전적으로, 실제 URL을 얻습니까?

위의 추상 링크에서 웹 사이트를 생성하는 또 다른 방법이 있으므로 Python의 Urllib에서 가져올 수 있습니다.

편집하다:

위에서 본 코드를 일반화했지만 특정 JavaScript를 리버스 엔지니어링하여 사용할 수 있어야한다고 들었습니다.

.js- 링크 - http://a.quizlet.com/j/english/create_setku80j8.js

링크가있는 사이트 링크 :

<a onclick="importText(); return false" href="#">Bulk-import data</a>

사이트의 실제 URL : http://quizlet.com/create_set/

위의 관련 .js의 아름다운 JS : http://pastie.org/737042

해결책

해당 스크립트에서 컨텐츠 생성 또는 링크 가로지는 코드를 즉시 보지 못합니다. 모두 importText DID는 몇 개의 div가 표시되는지 전환하는 것입니다.

WebApp이 특정 조치를 취하기 위해 전화를 공부하려면 봇에서 재생산하기 위해 브라우저가 수행하는 동안 HTTP 요청 (양식 제출 및 Ajax 호출)을 보는 것이 가장 좋습니다. 동작. FireBug의 'NET'패널을 사용하여 Firefox 또는 IE 용 Fiddler를 연구 할 수 있습니다.

다른 팁

무슨 일이 일어나고 있는지 해결하기 위해 JavaScript를 리버스 엔지니어링해야 할 것입니다.

사이트와 해당 링크를 제공 할 수 있습니까?

라이센스 : CC-BY-SA ~와 함께 속성

제휴하지 않습니다 StackOverflow