Biblioteca de download do site
-
20-09-2019 - |
Pergunta
Preciso montar um pequeno projeto para mim e preciso de alguma funcionalidade para baixar uma página para visualização offline. Existe uma biblioteca que baixará uma determinada página e suas imagens incorporadas e edite as tags IMG para refletir os locais locais das imagens.
Eu sei que existem muitos downloaders de sites por aí, mas não consigo encontrar algo que possa usar diretamente no meu código.
Eu tenho alguns scripts básicos feitos no Python, então o Python é muito bem -vindo. Mas praticamente qualquer idioma fará.
Solução
Sim, beltopoup + python urllib módulo
Outras dicas
Você está procurando Belo grupo.
Que tal o rastreador da web do Python?http://code.google.com/p/pywebcrawler/
Ou, anêmona (rubi)?http://anemone.rubyforge.org/
Solução mais simples em que consigo pensar.
wget -p example.com