Pregunta

Estoy trabajando en un proyecto que consiste en convertir una gran cantidad de contenido HTML en llano / texto. Tengo un módulo personalizado-escrito que hace permiso de trabajo, pero me pregunto si hay algunas herramientas estándar para ayudar a hacer el trabajo.

¿Fue útil?

Solución

Html2Text parece ser una buena opción

Otros consejos

Aquí hay una biblioteca de Python, que hace análisis de HTML:

BeautifulSoup es otra opción.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top