العلامات الكنسية و UTF8
-
27-09-2019 - |
سؤال
هل سيتم عرض علامات الارتباط الكنسيتين التالية من قبل العناكب على أنها تشير إلى عنوان URL نفسه؟
<link rel="canonical" href="http://www.example.com/ŷ" />
- مشفرة
<link rel="canonical" href="http://www.example.com/ŷ" />
- غير مشفر
المحلول
ŷ
هو كيان HTML الذي يمثل حرف Unicode مع نقطة الكود 375 في تدوين عشري. في سداسي عشري سيكون 0x177 لذلك نحن نتحدث عن u+0177 وهو ŷ
.
- http://en.wikipedia.org/wiki/list_of_xml_and_html_character_entity_references
- http://inamidst.com/stuff/unidata/
- http://www.fileformat.info/info/unicode/char/0177/index.htm
هذا يعني أن كلا urls متماثلان تمامًا إذا:
- يتم عرضها في سياق مستند HTML.
- تعلن المستند عن مجموعة أحرف مناسبة تدعم مثل هذا الرمز والمحرر الذي استخدمته لكتابته ، أدرج الرمز الصحيح.
إذا عرض المتصفح ŷ في كلتا الحالتين ، فمن المحتمل أن تكون مجموعة الأحرف صحيحة ولكن يجب عليك التأكد من ذلك.
نصائح أخرى
ليس متأكدا بنسبة 100 ٪ ، لكنني أعتقد أنهما سيشير كلاهما إلى عنوان URL نفسه. لكن ضع في اعتبارك أن النظر إلى معايير W3 ، فهي تقترح غالبًا روابط ليتم تشفيرها.
إذا قمت بتوصيل HTML الخاص بك كما UTF-8 ، يُنظر إلى عنوان URL على أنه نفسه.
على الرغم من أنه يمكنك توقع أن تعمل في المتصفحات الحديثة ، http://www.example.com/ŷ
هو عنوان URL غير صالح.
يجب عليك دائمًا تشفير أحرف Unicode.