NXXMLParserを使用してXMLドキュメント内の単語「ネスレ」（UTF-8エンコーディング）通報。何か案が？

https://stackoverflow.com/questions/932666

06-09-2019
|

質問

私たちはすべてUTF-8でエンコードされている私たちのXMLドキュメントを、解析するObjective-CでNSXMLParserを使用しています。一つの文書は（...<title>Nestlé Novelties</title>...のように）その中に文字列「ネスレ」を持っています。パーサはただによる単語「ネスレ」の終わりにフランス語の文字「E」にエラーコード= 9、とのエラーを報告し、終了します。さらに、我々は直接、同じ文書を表示するにはIE、クローム、サファリを使用してみました。彼らは、同様のエンコーディングエラーを報告しました。

私たちは、それらのすべてが文書のトップとして「<?xml version="1.0" encoding="UTF-8" ?>」を持っていることを意味し、すべての着信XMLドキュメントのUTF-8を使用しています。

これはエンコーディングの問題ですか？もしそうなら、どのように我々はこれを解決するのですか？私たちは、XML文書のすべてのためにどのようなエンコーディングを使用する必要がありますか？事前に感謝します！

バークレー

正しい解決策はありません

他のヒント

あなたは「E」は確かにUTF-8、0xC3の0xA9であることを確認するために、バイナリエディタでファイルを確認しましたか？

HTMLでは、私はNestléを使用することは、アプリケーションのためのその仕事をしていますか？

私は例のXMLファイルでちょうど今見たものは（é文字を含めることが起こった）ユーザー定義の入力を含む文字列がCDATA宣言で含むタグの内容を包んだということでした。これは、パーサが完全にそこに含まれる文字を無視する効果を有している。

ライセンス： CC-BY-SA と帰属

所属していません StackOverflow