Проблема со словом «Nestlé» в XML-документе (кодировка UTF-8) с использованием NXXMLParser.Есть идеи?
-
06-09-2019 - |
Вопрос
Мы используем NSXMLParser в Objective-C для анализа нашего XML-документа, который все имеют кодировку UTF-8.В одном документе есть строка «Нестле» (как в ...<title>Nestlé Novelties</title>...
).Анализатор только что завершил работу, сообщив об ошибке с кодом ошибки = 9 из-за французской буквы «е» в конце слова «Nestle».Кроме того, мы пытались использовать IE, Chrome, Safari, чтобы напрямую показать тот же документ.Они сообщили об аналогичной ошибке кодирования.
Мы используем UTF-8 для всех входящих XML-документов, а это означает, что все они имеют "<?xml version="1.0" encoding="UTF-8" ?>
" в верхней части документа.
Это проблема с кодировкой?Если да, то как нам это решить?Какую кодировку нам следует использовать для всех наших XML-документов?Заранее спасибо!
Барклай
Нет правильного решения
Другие советы
Проверили ли вы файл с помощью шестнадцатеричного редактора, чтобы убедиться, что «é» действительно имеет кодировку UTF-8? 0xC3
0xA9
?
В HTML, я хотел бы использовать Nestlé
ли эту работу для вашего приложения?
В примере XML-файла я только что увидел, что строка, содержащая определяемый пользователем ввод (которая случайно включала символы é), заключала содержимое содержащего тега в объявления CDATA.Это приводит к тому, что синтаксический анализатор полностью игнорирует содержащиеся в нем символы.