Frage

Ich habe oft an der Arbeit mit fragilen älteren Websites, dass Bruch auf unerwartete Weise, wenn Logik oder Konfiguration aktualisiert werden.

Ich habe nicht die Zeit oder das Wissen des Systems ein Selenium Skript zu erstellen, benötigt. Außerdem möchte ich nicht einen bestimmten Anwendungsfall überprüfen - ich jeden Link und Seite auf der Website überprüfen mag.

Ich möchte ein automatisiertes System Test erstellen, die über eine Website und prüfen, ob defekte Links und Abstürze Spinne wird. Im Idealfall wäre es ein Tool sein, dass ich dies zu erreichen, verwenden könnte. Es sollte möglichst viele der folgenden Merkmale hat, in der Reihenfolge ihrer Priorität:

  • via Skript Triggered
  • erfordert keine menschliche Interaktion
  • Folgt alle Links mit Anker-Tags und Links zu CSS und JS-Dateien
  • Erzeugt ein Protokoll aller gefunden 404s, 500s etc.
  • Kann lokal eingesetzt werden Websites auf Intranets zu überprüfen
  • Unterstützung Cookie / formularbasierte Authentifizierung
  • Free / Open Source

Es gibt viele Teillösungen gibt, wie FitNesse , Firefox Linkchecker und die W3C Link Checker , aber keiner von ihnen alles tun, was ich brauche.

Ich möchte diesen Test mit Projekten verwenden, um eine Reihe von Technologien und Plattformen, so dass die mehr tragbar die Lösung, desto besser.

Ich weiß, dies kein Ersatz für eine ordnungsgemäßen Systemtest ist, aber es wäre sehr hilfreich, wenn ich eine bequeme und automatisierbare Weise der Überprüfung habe, dass kein Teil des Geländes war offensichtlich gebrochen.

War es hilfreich?

Lösung

Ich verwende Xenus Link Sleuth für diese Art der Sache. überprüfen schnell ohne deadlinks usw. auf einer / einem beliebigen Stelle. zeigen Sie sie einfach an jedem URI, und es werden alle Links auf dieser Website Spinne.

Desription vom Standort:

  

Xenus Link Sleuth (TM) prüft Web   Websites für defekte Links. Verknüpfung   Überprüfung auf „normal“ getan   Links, Bilder, Rahmen, Plug-In,   Hintergründe, lokale Image-Maps, Stil   Blätter, Skripte und Java-Applets. Es   zeigt eine kontinuierlich aktualisierte Liste   URLs, die Sie durch verschiedene sortieren   Kriterien. Ein Bericht kann erzeugt werden   jederzeit möglich.

Es erfüllt alles, was Sie Anforderungen abgesehen davon, dass skriptfähig, da es eine Windows-Anwendung ist, die ausgehend erfordert manuell.

Andere Tipps

Wir verwenden und wirklich wie Linkcheckers:

http://wummel.github.io/linkchecker/

Es ist Open-Source, Python, Befehlszeile, intern einsetzbare und gibt es zu einer Vielzahl von Formaten. Der Entwickler ist sehr hilfreich, wenn wir ihn mit Fragen kontaktiert haben.

Wir haben ein Ruby-Script, das unsere Datenbank der internen Webseiten abfragt, Kicks off Linkchecker mit den entsprechenden Parametern für jede Website, und analysiert die XML, dass Linkchecker gibt uns einen benutzerdefinierten Fehlerbericht für jeden Standort in unserem CMS zu erstellen.

Was Teil Ihrer Liste wird der W3C Link Checker erfüllt nicht? Das wäre diejenige, die ich verwenden würde.

Alternativ Köper (Python-basiert) ist eine interessante kleine Sprache für diese Art der Sache. Es hat einen Link-Checker-Modul aber ich glaube nicht, es rekursiv arbeitet, so dass die nicht so gut für Spidern. Aber man könnte es ändern, wenn Sie mit dem vertraut sind. Und ich könnte falsch sein, könnte es eine rekursive Option sein. Lohnt sich jedenfalls.

Sie möchten vielleicht für diese mit wget versuchen. Es kann eine Website, einschließlich der „Seite Requisiten“ (d-Dateien) Spinne und kann so konfiguriert werden, um Fehler zu protokollieren. Ich weiß nicht, ob es genügend Informationen für Sie haben, aber es ist kostenlos und kann unter Windows (Cygwin) sowie Unix.

InSite ist ein kommerzielles Programm, das zu tun scheint, was Sie wollen ( haben sie nicht benutzt).

Wenn ich in den Schuhen war, würde ich wahrscheinlich diese Art von Spinne schreibe ich ...

Ich bin mir nicht sicher, dass es Form-Authentifizierung unterstützt, aber es wird Cookies umgehen, wenn Sie es geht auf der Website erhalten und ansonsten denke ich, checkbot wird alles auf Ihrer Liste tun. Ich habe als einen Schritt in Build-Prozess verwendet vor, dass nichts auf einer Website gebrochen zu überprüfen. Es gibt einen Beispiel Ausgabe auf der Website.

Ich habe immer gern linklint für Links auf einer Website zu überprüfen. Aber ich glaube nicht, dass alle Kriterien erfüllt, insbesondere die Aspekte, die JavaScript abhängig sein kann. Ich denke auch, wird es die Bilder von innen CSS genannt verpassen.

Aber für alle Anker Spidern, es funktioniert super.

Versuchen Sie SortSite . Es ist nicht kostenlos, aber es scheint alles zu tun, was Sie brauchen und vieles mehr.

Alternativ PowerMapper von der gleichen Firma hat ein ähnlicher-but-anderer Ansatz. Letztere wird Ihnen weniger Informationen über detaillierte Optimierung Ihrer Seiten, aber immer noch keine defekte Links identifizieren, etc.

Disclaimer: Ich habe ein finanzielles Interesse an dem Unternehmen, die diese Produkte machen

.

Versuchen Sie http://www.thelinkchecker.com ist eine Online-Anwendung, dass die Kontrollen Anzahl der ausgehenden Links, page Rank, Anker, Anzahl der ausgehenden Links. Ich denke, das ist die Lösung die Sie benötigen.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top