Pregunta

Nuestro sitio web ejecuta la entrada del usuario a través de htmltidy para limpiarla. Aparentemente, al hacer esto, también causa dolor a nuestros suscriptores internacionales al convertir Umlauts. ¿Hay alguna opción para especificar para htmltidy para no hacer esto?

Intenté caracteres con todas las opciones posibles, pero nada parece estar funcionando.

¿Fue útil?

Solución

Simplemente proporcione una codificación de salida (la codificación de entrada es opcional) en el archivo de configuración:

input-encoding: win1252
output-encoding: latin1

Para obtener una descripción general de las codificaciones disponibles, mire el documentación de codificación de salida.

EDITAR: Entonces estás usando el ANIZACIONES DE .NET. Es la misma configuración:

Document d = new Document(new FileStream("in.html", FileMode.Open));

d.InputCharacterEncoding = EncodingType.Utf8;
d.OutputCharacterEncoding = EncodingType.Win1252;
d.CleanAndRepair();

d.Save("out.html");

Con el conjunto de codificaciones correctas, obtendrá el resultado correcto, sin ü y similares.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top