Cómo By Pass Super Cache WP usando Python?
Pregunta
Estoy tratando de recoger datos de un blog con frecuencia la actualización, por lo que simplemente utilizar un bucle while que incluye urllib2.urlopen: a ( "http \ example.com") actualizar la página cada 5 minutos para recoger los datos que querido.
Pero noto que ahora no recibo el contenido más reciente de esta manera, es diferente de lo que veo a través del navegador como Firefox, y después de comprobar tanto el código fuente de Firefox y la misma página que recibo de pitón, he encontrado que es super GT caché que me está impidiendo conseguir el resultado más reciente.
Y sigo teniendo la misma página caché incluso si la parodia de las cabeceras en mi código Python. Por eso me pregunto ¿hay una manera de super caché pase WP? Y por qué no hay tal caché súper en Firefox en absoluto?
Solución
¿Usted ha intentado cambiar la dirección URL con algunos datos inofensivos? Algo como esto:
import time
urllib2.urlopen("http:\example.com?time=%s" % int(time.time()))
En realidad llamará http:\example.com?time=1283872559
. La mayoría de los sistemas de almacenamiento en caché de derivación de la caché si hay una cadena de consulta o se trata de algo que no se espera.