質問
の上 「Twill」ドキュメントページ それは書かれている:
デフォルトでは、 ツイル ページを実行します 几帳面 それらを処理する前に。これはデフォルトで続いています Python 解析するライブラリ HTML 間違ったことに対処するのは非常に悪いです HTML, 、そして多くの場合、「Real World」Webページで誤った結果を返します。この機能を無効にするには、セットを設定します config do_run_tidy 0
しかし、これはどこにありますか 几帳面 内部にあるプログラム ツイル?ダウンロードしました」Twill 0.9" と 「Twill」フォルダーの内容を調べました - 名前が付けられるそのようなファイル(またはモジュール)が見つかりません」几帳面"
解決
Twillは、システムにインストールされている場合、Tidyのコマンドラインバージョンを使用します。コードをクリーンにするためにTidyを呼び出す方法は、utils.pyにあり、名前が付けられています。run_tidy
'。コマンドによって呼ばれる」tidy_ok
'Commands.pyで定義されています
もしも use_tidy Trueに設定されています(デフォルトでは) _cleanup_html
メソッドイン ConfigureableParsingFactory 呼び出します run_tidy
方法
所属していません StackOverflow