Pregunta

en "sarga" página de documentación está escrito:


Por defecto, sarga se ejecutará páginas a través de ordenado antes del procesamiento ellos. Esto está activada de forma predeterminada, ya los Python bibliotecas que parse HTML son muy malo en tratar con incorrectos HTML , y con frecuencia devolver resultados incorrectos en "real mundo" páginas Web. Para desactivar esta característica, set config do_run_tidy 0


Pero ¿dónde está este ordenada programa ubicado en el interior sarga ? He descargado " sarga 0,9 " y mirado en "sarga "contenido de la carpeta - no puedo encontrar allí un archivo de este tipo (o un módulo) que se denomina ' ordenada '

¿Fue útil?

Solución

sarga utiliza la versión de línea de comandos de la ordenada si se ha instalado en su sistema. el método que llama ordenada para limpiar su código se encuentra en el utils.py y nombrado 'run_tidy'. su llamado por el comando 'tidy_ok' que se define en commands.py

si use_tidy está establecido en true (que es por defecto) el método _cleanup_html en ConfigurableParsingFactory llama al método run_tidy

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top