Website-Downloader Bibliothek
-
20-09-2019 - |
Frage
Ich brauche zusammen ein kleines Projekt setzen für mich, und ich brauche einige Funktionen eine Seite für die Offline-Wiedergabe herunterzuladen. Gibt es eine Bibliothek, die eine bestimmte Seite und seine eingebettete Bilder herunterladen, und bearbeiten die img-Tags, die lokalen Standorte der Bilder zu reflektieren.
Ich weiß, es gibt eine Menge von Website-Download- da draußen ist, aber ich kann etwas finden, dass ich direkt in meinem Code verwenden kann.
habe ich einige grundlegende Skripte in Python getan, so Python sehr willkommen ist. aber so ziemlich jede Sprache tun wird.
Lösung
Ja, BeautifulSoup + Python urllib Modul
Andere Tipps
Sie suchen BeautifulSoup .
Wie wäre es Python Web-Crawler? http://code.google.com/p/pywebcrawler/
OR, Anemone (Rubin)? http://anemone.rubyforge.org/
einfachste Lösung, die ich denken kann.
wget -p example.com