مشكلة مع Word "نستله" في ووك XML (ترميز UTF-8) باستخدام NXXMLPARSER. اي فكرة؟

StackOverflow https://stackoverflow.com/questions/932666

سؤال

نحن نستخدم NSXMLPARSER في Objective-C لتحليل مستند XML لدينا، والتي تشفير جميع UTF-8. وثيقة واحدة لديها سلسلة "نستله" في ذلك (كما في ...<title>Nestlé Novelties</title>...). المحلل المحلل تحلل فقط، والإبلاغ عن خطأ في رمز الخطأ = 9، بسبب الحرف الفرنسي "E" في نهاية كلمة "نستله". علاوة على ذلك، حاولنا استخدام IE، Chrome، Safari لإظهار نفس المستند مباشرة. أبلغوا عن خطأ ترميز مماثل.

نحن نستخدم UTF-8 لجميع وثيقة XML الواردة، مما يعني أن جميعهم لديهم "<?xml version="1.0" encoding="UTF-8" ?>"كأعلى الوثيقة.

هل هذه مشكلة ترميز؟ إذا كان الأمر كذلك، كيف نحل هذا؟ ما الترميز الذي يجب أن نستخدمه لجميع مستندات XML لدينا؟ شكرا مقدما!

barclay.

لا يوجد حل صحيح

نصائح أخرى

هل قمت بفحص الملف باستخدام محرر سداسي عشري للتحقق من أن "é" هو InteuT UTF-8، 0xC3 0xA9 ?

في أتش تي أم أل، أود استخدام Nestl&eacute; هل هذا يعمل من أجل طلبك؟

شيء رأيته الآن في مثال ملف XML هو أن سلسلة تحتوي على إدخال محدد من قبل المستخدم (الذي حدث لتضمين أحرف é) ملفوفة محتويات العلامة المحتوية في تصريحات CDATA. هذا له تأثير جعل المحلل يتجاهل تماما الشخصيات الواردة فيه.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top