Pregunta

Tengo un documento bastante grande en formato html que se generó a partir de Microsoft Word. Está muuuuy desordenado y lleno de cosas hinchadas (como etiquetas desconocidas, espacios de nombres desconocidos, etc. y otras cosas hinchadas)

¿hay alguna forma de convertirlo en sintaxis html simple?

¿Fue útil?

Solución

Pruebe HTML Tidy . Escuché que funciona bastante bien en HTML generado por MS Word (definitivamente al menos hasta Word 2000, pero probablemente también en versiones más recientes).

Otros consejos

Esto no es realmente una pregunta de programación, pero (al menos las versiones recientes de) Word puede guardar en " Página web, Filtrado " ;, que elimina las etiquetas y propiedades específicas de Office y solo deja las etiquetas necesarias para que el documento se represente en un navegador web. Por lo tanto, si tiene Word, puede intentar usarlo para abrir el documento HTML y guardarlo en ese formato.

Probablemente esté buscando HTML Tidy , que tiene adaptadores en bastante casi todos los idiomas que hay Tiene opciones para limpiar la salida HTML de Microsoft Word (y muchas otras características).

pruebe herramienta en línea Cleanup HTML para limpiar palabras HTML

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top