Como faço para parar os mecanismos de pesquisa indexando uma página de manutenção
Pergunta
Preciso configurar uma página de manutenção para um site que estou em execução, por exemplo, para exibição quando estou executando a manutenção do site (tempo de inatividade programado) ou se algo realmente quebrar e preciso colocar uma página de espera.
Existe algo de especial que eu preciso fazer para garantir que os rastreadores de mecanismos de pesquisa não o indexem e pensem que é meu site. Ou devo fazer um 404, adicionar um arquivo robots.txt temporário ou algo assim? Basicamente, não quero que eles o indexem como meu site, mas também não quero que eles pensem que meu site está morto e não volte.
Editar: Aqui está o que eu fiz no Apache: ErrorDocument 503 /.erver-maindentente.html rewriteEngine no rewriture!texto forte
Solução
Você deve enviar um 503 Service Unavailable
Código de status HTTP, e não um 404
. Use isso em conjunto com um Retry-After
Cabeçalho para contar aos robôs quando voltar.
Outras dicas
Você pode usar um robots.txt
Além disso, o Google possui um validador em suas ferramentas de webmasters.
Retornando 503 Service Unavailable
diz ao Google Bots para voltar mais tarde. Há um google página de suporte descrevendo os códigos de erro HTTP e como eles são interpretados por eles.
Você também pode usar Cabeçalho de resposta de repetição após para sugerir o tempo mínimo, após o qual seu site foi verificado novamente para disponibilidade.
Outra abordagem seria não vincular a página de manutenção de qualquer outra página do seu site (ou qualquer outro site).