Pregunta

A menudo tienen que trabajar con sitios web heredados frágiles que se rompen de manera inesperada cuando la lógica o la configuración se actualizan.

No tengo el tiempo o el conocimiento del sistema necesario para crear una href="http://selenium.org/" rel="noreferrer"> selenio guión

Me gustaría crear una prueba del sistema automatizado que le araña a través de un sitio y comprobar si hay enlaces rotos y los accidentes. Lo ideal sería que no habría una herramienta que podría utilizar para lograr esto. Debe tener el mayor número posible de las características siguientes, en orden de prioridad:

  • Se activa a través de script
  • no requiere interacción humana
  • Sigue todos los enlaces que incluyen etiquetas de anclaje y enlaces a los archivos CSS y JS
  • Produce un registro de todas las que se encuentran 404, 500s, etc.
  • Puede ser desplegado a nivel local para comprobar los sitios en intranets
  • Apoyos galleta / del formulario de autenticación basada
  • libre / código abierto

Hay muchas soluciones parciales por ahí, como FitNesse , de Firefox LinkChecker y la W3C comprobador de enlaces, pero ninguno de ellos hacen todo lo que necesito.

Me gustaría utilizar esta prueba con los proyectos que utilizan una gama de tecnologías y plataformas, por lo que el más portátil la solución mejor.

Me di cuenta que no es un sustituto adecuado para las pruebas del sistema, pero sería muy útil si tuviera una forma cómoda y automatizable de verificar que ninguna parte del sitio fue obviamente roto.

¿Fue útil?

Solución

Xenu Link Sleuth para este tipo de cosas. comprobar rápidamente sin vínculos muertos, etc. en un / cualquier sitio. El punto justo en cualquier URI y va araña todos los enlaces en ese sitio.

desription de un sitio:

  

Xenu Link Sleuth (TM) comprueba Web   sitios de enlaces rotos. Enlazar   verificación se realiza en "normal"   enlaces, imágenes, cuadros, plug-ins,   fondos, mapas de imagen, estilo   hojas, scripts y applets Java. Eso   muestra una lista actualizada de forma continua   URL que se puede ordenar por diferentes   criterios. Un informe puede ser producido a   cualquier momento.

Se reúne todo lo que estamos requisitos aparte de ser de secuencias de comandos, ya que es una aplicación de Windows que requiere manualmente inicial.

Otros consejos

usar y realmente como Linkchecker:

http://wummel.github.io/linkchecker/

Es de código abierto, Python, de línea de comandos, a nivel interno de despliegue, y salidas a una variedad de formatos. El desarrollador ha sido de gran ayuda cuando lo hemos puesto en contacto con los problemas.

Tenemos un script Ruby que consulta la base de datos de sitios web internos, arranca LinkChecker con los parámetros adecuados para cada sitio, y analiza el XML que LinkChecker nos da para crear un informe de error personalizado para cada sitio en nuestro CMS.

¿Qué parte de su lista no cumple con el comprobador de enlaces W3C? Ese sería el que yo usaría.

Como alternativa, sarga (basado en Python) es un lenguaje poco interesante para este tipo de cosas. Tiene una enlace módulo corrector pero no creo que funciona de forma recursiva, por lo que de no tan bueno para rastreo. Pero se puede modificarlo si se siente cómodo con eso. Y yo podría estar equivocado, podría ser una opción recursiva. Vale la pena ver, de todos modos.

Es posible que desee intentar usar wget para esto. Se puede araña un sitio que incluye los articulos para recreo o "página" (es decir, archivos) y puede ser configurado para registrar los errores. No sé si tendrá suficiente información para usted, pero es gratuito y está disponible en Windows (Cygwin), así como UNIX.

InSite es un programa comercial que parece hacer lo que quiere ( no lo han utilizado).

Si estuviera en sus zapatos, probablemente me escribir esta especie de araña mí mismo ...

No estoy seguro de que es compatible con la autenticación de forma, sino que se encargará de las cookies si usted puede ponerlo en marcha en el sitio y por lo demás creo Checkbot hará todo en su lista. He usado como un paso en proceso de construcción antes para comprobar que no hay nada roto en un sitio. Hay una ejemplo de salida en la página web.

Siempre me ha gustado linklint para la comprobación de enlaces en una página web. Sin embargo, no creo que cumple con todos los criterios, en particular los aspectos que pueden ser dependientes de JavaScript. También creo que se perderá las imágenes llamadas desde el interior de CSS.

Pero para spidering todos los anclajes, funciona muy bien.

Trate SortSite . No es gratis, pero parece hacer todo lo necesario y más.

Alternativamente, PowerMapper de la misma empresa tiene un enfoque similar, pero-diferente. Este último le dará menos información acerca de la optimización detallada de sus páginas, pero todavía identificar los enlaces rotos, etc.

Negación: tienen un interés financiero en la empresa que fabrica estos productos

.

Trate http://www.thelinkchecker.com es una aplicación online que comprueba el número de enlaces salientes, fila de la página, ancla, el número de enlaces salientes. Creo que esta es la solución que necesita.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top