Pregunta

¿Cuándo Google vuelve a rastrear un sitio? ¿Y por qué Google tiene dos versiones de la misma página en caché?

http://forum.portal.edu.ro/index.php ? showtopic = 112733 las páginas de caché son: forum.portal.edu.ro/index.php?showtopic=112733&st=25/ forum.portal.edu.ro/index.php?showtopic=112733&st=50

¿Fue útil?

Solución

Hay mucha discusión sobre la política de rastreo de Google. Lo mejor que puede hacer es verificar sus registros y determinar cuál es su horario para su sitio.

En cuanto a las múltiples entradas en el caché, Google no tiene forma de saber que no son la misma página; tienen URL diferentes y posiblemente datos diferentes. Si desea que se use una página específica, intente usar <link rel="canonical" href="(standard URL)">.

Otros consejos

La frecuencia con la que se vuelve a rastrear una página depende de qué tan alto sea su clasificación y qué intervalo de actualización haya sugerido en su mapa del sitio. También se pueden tener en cuenta algunos otros factores, como el contenido de la página y el tipo de sitios que enlazan con ella.

Las dos páginas en el caché no son en absoluto la misma página, una es la página dos en el hilo y la otra es la página tres. Como tienen URL diferentes y contenido diferente, son páginas separadas.

Si realmente desea que las páginas sean contadas como iguales por los motores de búsqueda, puede usar una etiqueta link con rel="canonical" para volver a la primera página del hilo.

@Chris: Configuración del sitio > Configuraciones & Gt; Establecer tasa de rastreo personalizada. esta configuración solo determina que con la velocidad a la que se puede rastrear su sitio, no establece la frecuencia de rastreo. para que su sitio obtenga más rastreos, intente publicar algunos enlaces de su sitio en otros sitios también.

Puede aumentar la velocidad a la que se arrastra, ajustando:

Configuración del sitio > Configuraciones & Gt; Establecer tasa de rastreo personalizada

Depende del tipo de contenido en el sitio web y también puede depender de su PageRank. Las páginas estáticas que proporcionan información que rara vez se actualiza pueden recibir una visita cada dos meses, y un blog popular con muchas publicaciones al día podría rastrearse varias veces al día. (aunque en el caso de un blog, generalmente el software de blogs hará ping a los motores de búsqueda y, por lo tanto, se rastreará a pedido)

Parece que se trata de publicaciones en foros en un sitio de tráfico moderado, por lo que debería rastrearse varias veces a la semana. Incluso mi propio sitio web, que actualmente tiene una clasificación de menos de 8,000,000 en Alexa, se rastrea cada semana a cada dos semanas con una solicitud de robots.txt casi diaria.

Las páginas con contenido similar deberían agruparse automáticamente, pero si no es así, pruebe rel = " canonical " propina dada por los otros respondedores.

@Chris: No, esa configuración no cambia la frecuencia con la que se rastrea su sitio, solo qué tan rápido Google solicita las páginas durante el rastreo. Es una configuración engañosa, y mucha gente comete ese error, a pesar de que las páginas de ayuda lo indican claramente.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top