JavaのSAXパーサでウムラウト
-
13-09-2019 - |
質問
私は現在、私が受け取ったXML文書にドイツ語のウムラウト値とのトラブルを抱えています。
これは/表示するように値を保存し、 "のüする" の代わりに "のüの"
XMLエンコーディングはウムラウトを表示することが可能であるべきののUTF-8に設定されている。
また、私はSAXパーサーにロケールを設定するための任意のオプションを見つけることができませんでした。
私は値が正しく保存することができます他の方法はありますか?
ところで:私はIDEとしてEclipseを使用しています。
すべてのヘルプは非常に感謝される!
事前に感謝します!
解決
XMLは、UTF-8でエンコードされていますが、ISO-8859-1でそれをデコードされます。
XMLのためInputStream
や他の「バイナリ」配向のAPIを使用してみてください。 Reader
を使用しないでください、またはXMLを解析する前にbyte[]
からString
に変換しようとしています。あなたは台無しパーサよりも文字エンコーディングに非常に可能性が高いです。
他のヒント
XML宣言でUTF-8にXMLエンコーディングを設定することは一つのことですが、別のものは、XML文書の物理的なエンコーディングですつまり、あなたは<?xml version="1.0" encoding="utf-8"?>
を言うXMLファイルを持つことができますが、ファイル自体はまだANSIエンコードされたかもしれません(または何でも)。
所属していません StackOverflow