Utilización de la clase difflib.HtmlDiff - mostrar caracteres individuales

StackOverflow https://stackoverflow.com/questions/6329192

  •  27-10-2019
  •  | 
  •  

Pregunta

Estoy utilizando la clase difflib.HtmlDiff , llamando a la función utilizando dos conjuntos de texto (HTML de las páginas web), sin embargo cuando se hace la tabla

html_diff = difflib.HtmlDiff()
print html_diff.make_table(previous_contents, fetch_url.page_contents)

Sin embargo, parece que acaba de comparar char char (1 carácter por fila de la tabla), y termino con un archivo txt 4.3MB para dos conjuntos de html que sólo son 100k.

El archivo doc dice:

Compares fromlines and tolines (lists of strings) and returns a string which is a 
complete HTML file containing a table showing line by line differences with 
inter-line and intra-line changes highlighted.

Sin embargo, que no parece ser el caso.

¿Alguna sugerencia?

¿Fue útil?

Solución

Usted está suministrando cadenas, no listas de cadenas (líneas).

Suponiendo extremos de la línea UNIX o Windows:

print html_diff.make_table(previous_contents.split('\n'),
                           fetch_url.page_contents.split('\n'))
Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top