La mejor manera de convertir HTML a texto plano usando Python
Pregunta
Estoy trabajando en un proyecto que consiste en convertir una gran cantidad de contenido HTML en llano / texto. Tengo un módulo personalizado-escrito que hace permiso de trabajo, pero me pregunto si hay algunas herramientas estándar para ayudar a hacer el trabajo.
Solución
Html2Text parece ser una buena opción
Otros consejos
Aquí hay una biblioteca de Python, que hace análisis de HTML:
BeautifulSoup es otra opción.
Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow