Frage

Ich bin die Prüfung unserer bestehenden Web-Anwendung, die starke Nutzung von HTML-Frames . Ich mag alle des HTML-Code in jedem Frame zum Download gibt es eine Methode, dies zu tun mit wget oder ein wenig Scripting?

War es hilfreich?

Lösung

als Ergänzung zu Steves Antwort:

Span zu jedem Host -'- H‘

Die ‚-H‘ Option schaltet Host-spanning, so Wget die rekursive Lauf ermöglicht durch einen Link verwiesen wird jedem Host zu besuchen. Falls nicht ausreichend Rekursion einschränkende Kriterien Tiefe angewendet werden, werden diese fremden Wirten verbinden typischerweise noch mehr Hosts und so weiter, bis Wget landet viel mehr Daten saugen, als Sie gedacht haben.

Begrenzungs Spanning auf bestimmten Domains -'- D‘

Die ‚-D‘ Option können Sie die Domänen angeben, die folgen wird, so dass die Rekursion Begrenzung nur für die Hosts, die zu diesen Bereichen gehören. Offensichtlich ist dies sinnvoll nur in Verbindung mit ‚H‘.

Ein typisches Beispiel wäre der Inhalt von ‚www.server.com‘ werden das Herunterladen, aber erlaubt Downloads von ‚images.server.com‘, etc.

      wget -rH -Dserver.com http://www.server.com/

Sie können mehr als eine Adresse angeben, indem sie mit einem Komma trennen,

z. ‚-Ddomain1.com, domain2.com‘.

entnommen aus: wget Handbuch

Andere Tipps

wget --recursive --domains=www.mysite.com http://www.mysite.com

, die eine rekursive Crawl zeigt auch in Frames und iframes durchqueren sollte. Achten Sie darauf, den Umfang der Rekursion nur auf Ihre Website zu begrenzen, da Sie wollen wahrscheinlich nicht die ganze Bahn kriechen.

wget hat eine Option -r es rekursiv zu machen, versuchen Sie wget -r -l1 im Fall (die Schrift macht es schwer zu lesen: dieser letzte Teil ist ein kleines L gefolgt von einer Nummer einer) Der -l1 Teil erzählt es auf eine maximale Tiefe von Rekursion 1. Versuchen mit dieser Nummer zu spielen mehr zu kratzen.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top