自動リンクチェッカーのためのシステムの検査[定休日]
-
22-09-2019 - |
質問
仕事が入ることが多いの脆弱なガウェブサイトの休憩う場合や論理構成を更新しました。
って時間がないまたは知識のシステムを実行することを可能にし セレン スクリプトもんチェックしたい特定の使用事例を確認したい毎のリンクやページのサイトです。
を作っていきたい自動化システムを試験するスパイダーによりサイトチェックのためのリンク切れやがクラッシュします。理想的にはあるものになる可能性があるツールが使えることです。持っていることがありときどきの人とコミュニケーションに順に優先順位
- ガスクリプトによ
- を必要としない人間の相互作用
- 以下のすべてのリンクを含むアンカータグリCSS jsファイル
- 生産履歴をすべて見404s,500番台。
- で展開する現地確認サイトイントラネット
- サクッキー/form-based認証
- オープンソース
多くの部分的なソリューションがあり、 FitNesse, FirefoxのLinkChecker や W3Cにリンクチェッカー, られましたが、いずれもいいと思います。
を使用したいのでこの試験プロジェクトを使用範囲の技術やプラットフォームにより可搬性の解づくりを行っています。
いうことではありませんの代替に適したシステムの試験ができなければならないときに便利であったかと便利でautomatableうことを検証することのない本サイトの一部が明らかにした。
解決
私はこの種のものは、ジヌーのリンクスルースを使用します。迅速/任意のサイトにはdeadlinksなどを確認してください。ただ、任意のURIでそれを指して、それがそのサイト上のすべてのリンクをスパイダーます。
サイトからDesriptionます:
ジヌーのリンクスルース(TM)チェックウェブ 壊れたリンクのためのサイト。リンク 検証は、「ノーマル」で行われます リンク、画像、フレーム、プラグイン、 背景、ローカルイメージマップ、スタイル シート、スクリプトやJavaアプレット。それ の継続的更新リストを表示 あなたが別の並べ替えることができたURL 基準。報告書は、で製造することができます いつでもます。
これは離れて、それは手動で起動を必要とするWindowsアプリだとスクリプト可能であることから、すべてのあなたのしている要件を満たしています。
他のヒント
私たちはLinkcheckerのように、本当に使用します:
http://wummel.github.io/linkchecker/する
これは、さまざまなフォーマットにオープンソース、パイソン、コマンドライン、内部的に展開、および出力です。我々は問題で彼に連絡してきたとき、開発者は非常に参考にされています。
私たちは、それぞれのサイトのための適切なパラメータを使用してLinkCheckerキックオフ、内部のウェブサイトの私達のデータベースを照会するRubyスクリプトを持っている、とLinkCheckerは私たちのCMS内の各サイトのカスタムエラーレポートを作成するために、私たちを与えることをXMLを解析します。
W3Cのリンクチェッカーは、あなたのリストのどの部分を満たしていませんか?それは私が使用するものであろう。
また、ツイルする(Pythonベース)この種のもののための興味深い少し言語です。これはリンクチェッカーモジュールを持っていますが、私はそうだと、それは再帰的に動作するとは思いませんないスパイダリングのために良いそう。あなたはそれに慣れている場合しかし、あなたはそれを変更することができます。そして私は、再帰的なオプションがあるかもしれない、間違っている可能性があります。フォートワースとにかく、チェックアウトします。
あなたはこのためにwgetを使用しようとする場合があります。これは、「ページの前提条件」(すなわちファイル)を含むサイトをスパイダーすることができますし、エラーを記録するように設定することができます。それはあなたのための十分な情報を持っているかどうかはわからないが、それは無料、利用可能なWindows上(cygwinの)だけでなく、UNIXのです。
のInSite には、(あなたがやりたいように見える商用プログラムです。それを使用していない)。
私はあなたの靴にあった場合、私はおそらく蜘蛛のこの種を書きたい自分...
私はそれがフォーム認証をサポートしていますが、それは現場に行くと、そうでない場合は、私が考える得ることができる場合には、クッキーを処理することはよく分からない<のhref =「http://degraaff.org/checkbot/」のrel =」 nofollowをnoreferrer "> Checkbot のあなたのリストに全力を尽くします。サイト上で壊れたことは何もチェックしないようにする前に、私は、ビルドプロセスのステップとして使用しました。ありますウェブサイト上の例の出力するます。
私はいつもサイトのリンクをチェックするために linklint に気に入っています。しかし、私はそれはすべてあなたの基準は、JavaScript依存することができる、特に側面を満たしているとは思いません。私はまた、内部CSSから呼び出された画像を欠場することだと思います。
しかし、すべてのアンカーをスパイダリングのために、それは素晴らしい作品ます。
SortSite してみてください。それは無料ではないですが、あなたがより多く必要とすべてを行うようです。
また、 PowerMapper の同じ会社から持って異なる類似した - しかし、アプローチ。後者は、あなたのページの詳細な最適化に関する以下の情報を提供しますが、それでもなど、任意の壊れたリンクを識別します。
免責事項:私はこれらの製品を作る会社の金融関心を持っているの
。http://www.thelinkchecker.com のそれは、出力リンクのオンラインアプリケーションその小切手番号です試してみてくださいページランク、アンカー、出力リンクの数。私は、これはあなたが必要とするソリューションだと思います。