NXXMLParserを使用してXMLドキュメント内の単語「ネスレ」(UTF-8エンコーディング)通報。何か案が?

StackOverflow https://stackoverflow.com/questions/932666

質問

私たちはすべてUTF-8でエンコードされている私たちのXMLドキュメントを、解析するObjective-CでNSXMLParserを使用しています。一つの文書は(...<title>Nestlé Novelties</title>...のように)その中に文字列「ネスレ」を持っています。パーサはただによる単語「ネスレ」の終わりにフランス語の文字「E」にエラーコード= 9、とのエラーを報告し、終了します。さらに、我々は直接、同じ文書を表示するにはIE、クローム、サファリを使用してみました。彼らは、同様のエンコーディングエラーを報告しました。

私たちは、それらのすべてが文書のトップとして「<?xml version="1.0" encoding="UTF-8" ?>」を持っていることを意味し、すべての着信XMLドキュメントのUTF-8を使用しています。

これはエンコーディングの問題ですか?もしそうなら、どのように我々はこれを解決するのですか?私たちは、XML文書のすべてのためにどのようなエンコーディングを使用する必要がありますか?事前に感謝します!

バークレー

正しい解決策はありません

他のヒント

あなたは「E」は確かにUTF-8、0xC30xA9であることを確認するために、バイナリエディタでファイルを確認しましたか?

HTMLでは、私はNestl&eacute;を使用することは、アプリケーションのためのその仕事をしていますか?

私は例のXMLファイルでちょうど今見たものは(é文字を含めることが起こった)ユーザー定義の入力を含む文字列がCDATA宣言で含むタグの内容を包んだということでした。これは、パーサが完全にそこに含まれる文字を無視する効果を有している。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top