문제

HTML 모형을 스크랩하고 페이지의 무결성을 유지할 수 있는 Linux 애플리케이션(또는 Firefox 확장 프로그램)을 찾고 있습니다.Firefox는 거의 완벽하게 작동하지만 CSS에서 참조되는 이미지를 가져오지 않습니다.

Firefox용 스크랩북 확장은 모든 것을 가져오지만 디렉터리 구조를 평면화합니다.

모든 폴더가 색인 페이지의 하위 폴더가 되어도 크게 개의치 않습니다.

도움이 되었습니까?

해결책

보다 wget을 사용한 웹사이트 미러링

wget --mirror –w 2 –p --HTML-extension –-convert-links http://www.yourdomain.com

다른 팁

시도해 보셨나요? 왜?

wget -r 원하는 대로 작동하며, 그렇지 않은 경우 이를 구성할 수 있는 플래그가 많이 있습니다.보다 man wget.

또 다른 옵션은 curl, 이는 훨씬 더 강력합니다.보다 http://curl.haxx.se/.

텔레포트 프로 이런 종류의 일에 아주 좋습니다.전체 웹사이트를 가리킬 수 있으며 디렉토리 구조를 로컬로 유지하고 필요에 따라 절대 링크를 상대 링크로 바꾸는 복사본을 다운로드합니다.또한 원본 사이트에서 링크된 다른 제3자 웹사이트의 콘텐츠를 원하는지 여부도 지정할 수 있습니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top