Dove viene “ordinato” trova nel “twill”?
Domanda
sul "twill" pagina di documentazione è scritto:
Per impostazione predefinita, twill verrà eseguito pagine attraverso ordine prima della lavorazione loro. Questo è attiva per default, perché Python le librerie che parse HTML sono molto male a trattare con errato HTML , e spesso restituire risultati non corretti sulla "reale mondo" pagine Web. Per disattivare questa caratteristica, insieme config do_run_tidy 0
Ma dov'è questo ordine programma che si trova all'interno twill ? Ho scaricato " twill 0.9 " e esaminato "twill "contenuto della cartella - non riesco proprio a trovare lì come un file (o un modulo) che sarebbe chiamato " ordine "
Soluzione
utilizza twill la versione a riga di comando di ordine se installato sul sistema. il metodo che chiama in ordine di pulire il codice si trova nel utils.py e denominato 'run_tidy
'. la sua chiamata dal comando 'tidy_ok
' che è definito nella commands.py
se use_tidy è impostato su vero (che è di default) il metodo _cleanup_html
in ConfigurableParsingFactory chiama il metodo run_tidy