Tréma en Java SAX
-
13-09-2019 - |
Question
Je suis actuellement des problèmes avec les valeurs de tréma allemand dans un document XML que j'ai reçu.
Il affiche / enregistre la valeur en tant que " ü " au lieu d'un " ü ".
Le codage XML est défini sur UTF-8 qui devrait être capable d'afficher trémas.
Aussi je ne pouvais pas trouver une option pour définir un lieu sur l'analyseur SAX.
Y at-il une autre façon que je peux faire les valeurs correctement enregistrer?
BTW: J'utilise Eclipse IDE.
Toute aide est très appréciée!
Merci d'avance!
La solution
Le XML est codé en UTF-8, mais vous décode avec ISO-8859-1.
Essayez d'utiliser InputStream
et d'autres « binaires » API pour XML à orientation. Évitez d'utiliser un Reader
, ou d'essayer de convertir byte[]
à un String
avant l'analyse XML. Vous êtes beaucoup plus susceptibles de gâcher le codage de caractères que l'analyseur est.
Autres conseils
Définition du codage XML en UTF-8 dans la déclaration XML est une chose, mais une autre chose est l'encodage physique du-à-dire de documents XML, vous pouvez avoir un fichier XML qui dit <?xml version="1.0" encoding="utf-8"?>
mais le fichier lui-même peut encore être ANSI codé (ou peu importe).