Pregunta

Tengo que poner un poco de proyecto junto a mí, y necesito algo de funcionalidad para descargar una página para verlas sin conexión. ¿Hay una biblioteca que se descarga una página determinada y sus imágenes incrustadas, y editar las etiquetas img para reflejar los lugares locales de las imágenes.

Sé que hay una gran cantidad de descargadores de sitios web por ahí, pero no puedo encontrar algo que pueda utilizar directamente en mi código.

Tengo algunas secuencias de comandos básicos realizados en Python, lo que Python es muy bienvenida. pero prácticamente cualquier idioma va a hacer.

¿Fue útil?

Solución

Sí, BeautifulSoup + pitón urllib módulo

Otros consejos

¿Qué hay de rastreador pitón web? http://code.google.com/p/pywebcrawler/

O, Anemone (rubí)? http://anemone.rubyforge.org/

solución más simple que se puede imaginar.

wget -p example.com
Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top