Cómo evitar que la htmltidy convierta umlauts (por ejemplo, ü to & uuml;)
-
20-09-2019 - |
Pregunta
Nuestro sitio web ejecuta la entrada del usuario a través de htmltidy para limpiarla. Aparentemente, al hacer esto, también causa dolor a nuestros suscriptores internacionales al convertir Umlauts. ¿Hay alguna opción para especificar para htmltidy para no hacer esto?
Intenté caracteres con todas las opciones posibles, pero nada parece estar funcionando.
Solución
Simplemente proporcione una codificación de salida (la codificación de entrada es opcional) en el archivo de configuración:
input-encoding: win1252
output-encoding: latin1
Para obtener una descripción general de las codificaciones disponibles, mire el documentación de codificación de salida.
EDITAR: Entonces estás usando el ANIZACIONES DE .NET. Es la misma configuración:
Document d = new Document(new FileStream("in.html", FileMode.Open));
d.InputCharacterEncoding = EncodingType.Utf8;
d.OutputCharacterEncoding = EncodingType.Win1252;
d.CleanAndRepair();
d.Save("out.html");
Con el conjunto de codificaciones correctas, obtendrá el resultado correcto, sin ü
y similares.