Question

Je dois mettre un petit projet ensemble pour moi-même, et j'ai besoin des fonctionnalités pour télécharger une page pour une consultation hors ligne. Y at-il une bibliothèque qui télécharge une page donnée et ses images intégrées, et modifier les balises img pour refléter les sites locaux des images.

Je sais qu'il ya beaucoup de sites Web téléchargeurs là-bas, mais je ne peux pas trouver quelque chose que je peux utiliser directement dans mon code.

J'ai quelques scripts de base fait en python, Python est donc la bienvenue. mais à peu près toutes les langues fera.

Était-ce utile?

La solution

Oui, BeautifulSoup + python urllib le module

Autres conseils

Vous cherchez BeautifulSoup .

Qu'en est-web crawler python? http://code.google.com/p/pywebcrawler/

OU, Anémone (rubis)? http://anemone.rubyforge.org/

solution la plus simple, je peux penser.

wget -p example.com
Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top