Utilización de la clase difflib.HtmlDiff - mostrar caracteres individuales
Pregunta
Estoy utilizando la clase difflib.HtmlDiff
, llamando a la función utilizando dos conjuntos de texto (HTML de las páginas web), sin embargo cuando se hace la tabla
html_diff = difflib.HtmlDiff()
print html_diff.make_table(previous_contents, fetch_url.page_contents)
Sin embargo, parece que acaba de comparar char char (1 carácter por fila de la tabla), y termino con un archivo txt 4.3MB para dos conjuntos de html que sólo son 100k.
El archivo doc dice:
Compares fromlines and tolines (lists of strings) and returns a string which is a
complete HTML file containing a table showing line by line differences with
inter-line and intra-line changes highlighted.
Sin embargo, que no parece ser el caso.
¿Alguna sugerencia?
Solución
Usted está suministrando cadenas, no listas de cadenas (líneas).
Suponiendo extremos de la línea UNIX o Windows:
print html_diff.make_table(previous_contents.split('\n'),
fetch_url.page_contents.split('\n'))
Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow