Pregunta

Estoy tratando de recoger datos de un blog con frecuencia la actualización, por lo que simplemente utilizar un bucle while que incluye urllib2.urlopen: a ( "http \ example.com") actualizar la página cada 5 minutos para recoger los datos que querido.

Pero noto que ahora no recibo el contenido más reciente de esta manera, es diferente de lo que veo a través del navegador como Firefox, y después de comprobar tanto el código fuente de Firefox y la misma página que recibo de pitón, he encontrado que es super GT caché que me está impidiendo conseguir el resultado más reciente.

Y sigo teniendo la misma página caché incluso si la parodia de las cabeceras en mi código Python. Por eso me pregunto ¿hay una manera de super caché pase WP? Y por qué no hay tal caché súper en Firefox en absoluto?

¿Fue útil?

Solución

¿Usted ha intentado cambiar la dirección URL con algunos datos inofensivos? Algo como esto:

import time
urllib2.urlopen("http:\example.com?time=%s" % int(time.time()))

En realidad llamará http:\example.com?time=1283872559. La mayoría de los sistemas de almacenamiento en caché de derivación de la caché si hay una cadena de consulta o se trata de algo que no se espera.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top