Pergunta

Costumo trabalhar com sites frágeis legados que quebram de maneiras inesperadas quando a lógica ou a configuração são atualizadas.

Não tenho tempo ou conhecimento do sistema necessário para criar um Selênio roteiro. Além disso, não quero verificar um caso de uso específico - quero verificar todos os links e páginas do site.

Gostaria de criar um teste de sistema automatizado que arraste através de um site e verifique se há links e falhas quebradas. Idealmente, haveria uma ferramenta que eu poderia usar para conseguir isso. Deve ter o máximo possível dos seguintes recursos, em ordem descendente de prioridade:

  • Acionado via script
  • Não requer interação humana
  • Segue todos os links, incluindo tags de âncora e links para arquivos CSS e JS
  • Produz um tronco de todos os 404s, 500s encontrados etc.
  • Pode ser implantado localmente para verificar os sites em intranets
  • Suporta autenticação baseada em cookie/formulário
  • Código livre/de código aberto

Existem muitas soluções parciais por aí, como Fitness, LinkChecker do Firefox e O verificador de link W3C, mas nenhum deles faz tudo o que preciso.

Gostaria de usar esse teste com projetos usando uma variedade de tecnologias e plataformas, para que, quanto mais portátil a solução, melhor.

Sei que isso não substitui o teste adequado do sistema, mas seria muito útil se eu tivesse uma maneira conveniente e automatizável de verificar se nenhuma parte do site foi obviamente quebrada.

Foi útil?

Solução

eu uso Link de Xenu Sleuth Para esse tipo de coisa. Verifique rapidamente sem deadlinks etc. em A/qualquer site. Apenas aponte para qualquer URI e ele aranha todos os links nesse site.

Desdription do site:

O Link Sleuth (TM) de Xenu verifica os sites da Web para links quebrados. A verificação do link é feita em links "normais", imagens, molduras, plug-ins, fundos, mapas de imagens locais, folhas de estilo, scripts e applets java. Ele exibe uma lista de URLs atualizada continuamente que você pode classificar por critérios diferentes. Um relatório pode ser produzido a qualquer momento.

Ele atende a todos os seus requisitos, além de ser scriptable, pois é um aplicativo do Windows que requer o início manualmente.

Outras dicas

Nós usamos e realmente gostamos de LinkChecker:

http://wummel.github.io/linkchecker/

É de código aberto, Python, linha de comando, implantável internamente e saídas para uma variedade de formatos. O desenvolvedor tem sido muito útil quando o contatamos com problemas.

Temos um script Ruby que consulta nosso banco de dados de sites internos, inicia o LinkChecker com parâmetros apropriados para cada site e analisa o XML que o LinkChecker nos fornece para criar um relatório de erro personalizado para cada site em nosso CMS.

Que parte da sua lista o verificador de link W3C não atende? Esse seria o que eu usaria.

Alternativamente, sarja (baseado em Python) é uma pequena linguagem interessante para esse tipo de coisa. Tem um Módulo de verificador de link Mas acho que não funciona recursivamente, então isso não é tão bom para arremessar. Mas você pode modificá -lo se estiver confortável com isso. E eu poderia estar errado, pode haver uma opção recursiva. Vale a pena conferir, de qualquer maneira.

Você pode querer tentar usar o WGET para isso. Ele pode despertar um site, incluindo os "requisitos de página" (arquivos do IE) e pode ser configurado para registrar erros. Não sei se terá informações suficientes para você, mas é gratuito e disponível no Windows (Cygwin) e no Unix.

Insite é um programa comercial que parece fazer o que você deseja (não o usou).

Se eu estivesse no seu lugar, eu provavelmente escreveria esse tipo de aranha ...

Não tenho certeza se ele suporta a autenticação de formulário, mas lidará com cookies se você conseguir fazer isso no site e, de outra forma, eu acho Checkbot fará tudo na sua lista. Eu já usei como uma etapa no processo de construção antes para verificar se nada quebrado em um site. Há uma Exemplo de saída no site.

Eu sempre gostei linklint Para verificar links em um site. No entanto, acho que não atende a todos os seus critérios, principalmente os aspectos que podem depender do JavaScript. Eu também acho que sentirá falta das imagens chamadas de Inside CSS.

Mas para arremessar todas as âncoras, funciona muito bem.

Tentar SiteSite. Não é gratuito, mas parece fazer tudo o que você precisa e muito mais.

Alternativamente, Powermapper Da mesma empresa tem uma abordagem semelhante, mas diferente. Este último fornecerá menos informações sobre a otimização detalhada de suas páginas, mas ainda identificará qualquer link quebrado, etc.

Isenção de responsabilidade: tenho um interesse financeiro na empresa que fabrica esses produtos.

Tentar http://www.thelinkchecker.com É um aplicativo on -line que verifica o número de links de saída, classificação de página, âncora, número de links de saída. Eu acho que esta é a solução que você precisa.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top