문제

웹 상호 작용, 즉 안전한 웹 사이트에서 파일의주기적인 다운로드를 자동화하려고합니다. 여기에는 기본적으로 사용자 이름/비밀번호를 입력하고 해당 URL로 탐색하는 것입니다.

Python에서 간단한 스크립팅을 시도한 다음보다 정교한 스크립팅을 시도했습니다.이 특정 웹 사이트가 로그인을위한 독창적 인 JavaScript 및 Flash 기반 메커니즘을 사용하여 내 방법을 쓸모없는 방법으로 만들었습니다.

그런 다음 htmlunit을 시도했지만 작동하고 싶지는 않습니다. 플래시의 사용이 문제라고 생각합니다.

나는 더 이상 그것에 대해 생각하고 싶지 않기 때문에 실제 브라우저를 스크립팅하여 로그인하고 필요한 파일을 가져 오기 위해 기대고 있습니다.

요구 사항은 다음과 같습니다.

  • Linux 서버에서 실행하십시오 (예 : X 실행 없음). 정말로 XI가 필요하다면 그렇게 할 수는 있지만 행복하지 않을 것입니다.
  • 신뢰할 수 있습니다. 나는이 일을 시작하고 다시는 생각하지 않습니다.
  • 스크립트 가능합니다. 너무 정교한 것은 없지만 브라우저에 다양한 단계와 방문 할 페이지를 알릴 수 있어야합니다.

헤드리스, X-Less 스크립트 가능한 브라우저를위한 좋은 툴킷이 있습니까? 이런 식으로 시도해 보셨습니까? 그렇다면 지혜의 말이 있습니까?

도움이 되었습니까?

해결책

IE 임베디드 브라우저와 관련 작업을 수행했습니다 (숨겨진 브라우저 구성 요소 패널이있는 GUI 응용 프로그램 이었지만). 실제로 당신은 무엇이든 할 수 있습니다 레이아웃 엔진 출력 로직을 잘라냅니다. 내비게이션은 스크립트와 같은 이벤트를 발사하여 수행해야합니다.

당신이 사용할 수있는 . Firefox (Gecko Engine)의 헤드리스 버전입니다. 브라우저를 요청을 수락 할 수있는 RESTFUL 서버로 전환합니다 ( "Fetch URL"). 따라서 HTML을 구문 분석하고 DOM으로 표시하고 수행 된 모든 스크립트에 대해 대기 정의 지연을 나타냅니다.

Linux에서 작동합니다. JS와 풍부한 Xulrunner 능력을 사용하여 목표를 위해 쉽게 확장 할 수 있다고 생각합니다.

다른 팁

는 어때 Phantomjs?

당신은 시도 했습니까? 셀렌? 이를 통해 Firefox의 확장자를 사용하여 사용 시나리오를 녹화 할 수 있으며, 나중에 여러 가지 다른 방법을 사용하여 다시 재생할 수 있습니다.

편집 : 나는 이것이 매우 늦은 응답이라는 것을 깨달았습니다. :)

살펴보십시오 WebKitdriver. 이 프로젝트에는 WebKit의 헤드리스 구현이 포함됩니다.

플래시 상호 작용을 수행하는 방법을 모르지만 (그리고 또한 관심이 있습니다) HTML/JavaScript의 경우 사용할 수 있습니다. 치킨 풋.

Linux에서 작동하는 Headless + Scriptable 브라우저를 얻으려면 사용할 수 있습니다. QT Webkit 라이브러리. 다음은 예제입니다.

이를 달성하기 위해 CouchDBS에 게시 한 크롬 확장자를 작성합니다.예시 그리고 그것 이불). 크로스 도메인 XHR을 허용하기 위해 매니페스트의 권한에 소파를 추가하십시오.

(나는 내가하고있는 일에 대한 헤드리스 대안을 찾아이 스레드에 도착했다.

또한이 웹 사이트의 기괴한 특성을 고려할 때 플래시 및 JavaScript를 가져 오기 위해 보안 구멍을 이용할 수 있는지 궁금해 할 수 없습니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top