質問

の上 「Twill」ドキュメントページ それは書かれている:


デフォルトでは、 ツイル ページを実行します 几帳面 それらを処理する前に。これはデフォルトで続いています Python 解析するライブラリ HTML 間違ったことに対処するのは非常に悪いです HTML, 、そして多くの場合、「Real World」Webページで誤った結果を返します。この機能を無効にするには、セットを設定します config do_run_tidy 0


しかし、これはどこにありますか 几帳面 内部にあるプログラム ツイル?ダウンロードしました」Twill 0.9" と 「Twill」フォルダーの内容を調べました - 名前が付けられるそのようなファイル(またはモジュール)が見つかりません」几帳面"

役に立ちましたか?

解決

Twillは、システムにインストールされている場合、Tidyのコマンドラインバージョンを使用します。コードをクリーンにするためにTidyを呼び出す方法は、utils.pyにあり、名前が付けられています。run_tidy'。コマンドによって呼ばれる」tidy_ok'Commands.pyで定義されています

もしも use_tidy Trueに設定されています(デフォルトでは) _cleanup_html メソッドイン ConfigureableParsingFactory 呼び出します run_tidy 方法

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top