Site Web bibliothèque téléchargeur
-
20-09-2019 - |
Question
Je dois mettre un petit projet ensemble pour moi-même, et j'ai besoin des fonctionnalités pour télécharger une page pour une consultation hors ligne. Y at-il une bibliothèque qui télécharge une page donnée et ses images intégrées, et modifier les balises img pour refléter les sites locaux des images.
Je sais qu'il ya beaucoup de sites Web téléchargeurs là-bas, mais je ne peux pas trouver quelque chose que je peux utiliser directement dans mon code.
J'ai quelques scripts de base fait en python, Python est donc la bienvenue. mais à peu près toutes les langues fera.
La solution
Oui, BeautifulSoup + python urllib le module
Autres conseils
Vous cherchez BeautifulSoup .
Qu'en est-web crawler python? http://code.google.com/p/pywebcrawler/
OU, Anémone (rubis)? http://anemone.rubyforge.org/
solution la plus simple, je peux penser.
wget -p example.com