Pergunta

Quando o Google re-crawl um site? E por que o Google tem duas versões da mesma página em cache ??

http://forum.portal.edu.ro/index.php ? ShowTopic = 112733 páginas de cache são: forum.portal.edu.ro/index.php?showtopic=112733&st=25/ forum.portal.edu.ro/index.php?showtopic=112733&st=50

Foi útil?

Solução

Há um monte de discussão sobre política de rastreamento do Google. O melhor que você pode fazer é verificar seus logs e determinar o que sua programação é para o seu site.

Como para as várias entradas na cache, o Google não tem como saber que eles não são a mesma página; eles têm URLs diferentes e dados possivelmente diferentes. Se você quer uma página específica para ser usado, tente usar <link rel="canonical" href="(standard URL)">.

Outras dicas

Como muitas vezes uma página é re-arrastou depende de quão alto é ranking é, eo que atualização intervalo você sugeriu em seu mapa do site. Alguns outros fatores também podem ser tidos em conta, como o conteúdo da página, e que tipo de sites que apontam para ele.

As duas páginas no cache não são de todo a mesma página, uma é a página dois do fio e o outro é a página três. Como eles têm URLs diferentes e diferentes conteúdos são páginas separadas.

Se você realmente deseja que as páginas a serem contados como o mesmo pelos motores de busca, você pode usar um tag link com rel="canonical" a ponto de volta para a primeira página do segmento.

@ Chris: Site Configuration> Configurações> Conf taxa de rastreamento. esta definição apenas determina que com a quantidade de velocidade de seu site pode ser rastreado, ele não define a frequência de rastreamento. para tornar seu site obter mais rastreamentos, tente postar alguns links do seu site para outros sites também.

Você pode aumentar a taxa na qual ele se arrasta, ajustando:

Site Configuration> Configurações> Conf taxa de rastreamento

Depende do tipo de conteúdo no site e pode também depender o seu PageRank. páginas estáticas com informações raramente atualizado pode obter uma visita a cada dois meses ou mais, e um blog popular, com muitas mensagens por dia pode obter rastreado várias vezes ao dia. (Embora no caso de um blog, geralmente o software de blogging irá executar ping motores de busca, e assim são rastreados on-demand)

Parece que esses são posts no fórum em um site moderada tráfego, por isso deve se arrastou algumas vezes por semana. Até o meu próprio site, que atualmente tem um sob 8.000.000 ranking no Alexa, será rastreado a cada semana para cada outra semana com um pedido robots.txt quase diária.

Páginas com conteúdo semelhante deve receber automaticamente agrupados juntos, mas se não for, tente a ponta "canônica" rel = dado pelos outros respondentes.

@ Chris: Não, essa configuração não muda quantas vezes o seu site é rastreado, apenas a quão rápido Google solicita as páginas durante o rastreamento. É um cenário enganosa, e um monte de gente cometer esse erro, mesmo que as páginas de ajuda indicam claramente isso.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top