Проблема со словом «Nestlé» в XML-документе (кодировка UTF-8) с использованием NXXMLParser.Есть идеи?

https://stackoverflow.com/questions/932666

06-09-2019
|

Вопрос

Мы используем NSXMLParser в Objective-C для анализа нашего XML-документа, который все имеют кодировку UTF-8.В одном документе есть строка «Нестле» (как в ...<title>Nestlé Novelties</title>...).Анализатор только что завершил работу, сообщив об ошибке с кодом ошибки = 9 из-за французской буквы «е» в конце слова «Nestle».Кроме того, мы пытались использовать IE, Chrome, Safari, чтобы напрямую показать тот же документ.Они сообщили об аналогичной ошибке кодирования.

Мы используем UTF-8 для всех входящих XML-документов, а это означает, что все они имеют "<?xml version="1.0" encoding="UTF-8" ?>" в верхней части документа.

Это проблема с кодировкой?Если да, то как нам это решить?Какую кодировку нам следует использовать для всех наших XML-документов?Заранее спасибо!

Барклай

Нет правильного решения

Другие советы

Проверили ли вы файл с помощью шестнадцатеричного редактора, чтобы убедиться, что «é» действительно имеет кодировку UTF-8? 0xC3 0xA9 ?

В HTML, я хотел бы использовать Nestlé ли эту работу для вашего приложения?

В примере XML-файла я только что увидел, что строка, содержащая определяемый пользователем ввод (которая случайно включала символы é), заключала содержимое содержащего тега в объявления CDATA.Это приводит к тому, что синтаксический анализатор полностью игнорирует содержащиеся в нем символы.

Лицензировано под: CC-BY-SA с атрибуция

Не связан с StackOverflow