روبي 1.9: كيف يمكنني صياغة سلاسل UPCES و DOWNCES Multibyte؟
-
19-09-2019 - |
سؤال
لذلك اتخذ موتز القرار للحفاظ على upcase
و downcase
تقتصر على /[A-Z]/i
في روبي 1.9.1.
ActiveSupport::Multibyte
منذ فترة طويلة جينغ حالة I18N كبيرة في روبي 1.8.x عبر String#mb_chars
.
ومع ذلك، عندما حاول بموجب روبي 1.9.1، لا يبدو أنه يعمل. إليك برنامج نصي اختبار بسيط كتبته، جنبا إلى جنب مع الإخراج الذي أحصل عليه:
$ cat test.rb
# encoding: UTF-8
puts("@ #{RUBY_VERSION} " + (__ENCODING__ rescue $KCODE).to_s)
sd, su = "Iñtërnâtiônàlizætiøn", "IÑTËRNÂTIÔNÀLIZÆTIØN"
def ps(u, d, k); puts "%-30s: %24s / %-24s" % [k, u, d] end
ps sd.upcase, su.downcase, "Plain ruby"
require 'rubygems'; require 'active_support'
ps sd.upcase, su.downcase, "With active_support"
ps sd.mb_chars.upcase.to_s, su.mb_chars.downcase.to_s, "With active_support mb_chars"
$ ruby -KU test.rb
@ 1.8.7 UTF8
Plain ruby : IñTëRNâTIôNàLIZæTIøN / iÑtËrnÂtiÔnÀlizÆtiØn
With active_support : IñTëRNâTIôNàLIZæTIøN / iÑtËrnÂtiÔnÀlizÆtiØn
With active_support mb_chars : IÑTËRNÂTIÔNÀLIZÆTIØN / iñtërnâtiônàlizætiøn
$ ruby1.9 test.rb
@ 1.9.1 UTF-8
Plain ruby : IñTëRNâTIôNàLIZæTIøN / iÑtËrnÂtiÔnÀlizÆtiØn
With active_support : IñTëRNâTIôNàLIZæTIøN / iÑtËrnÂtiÔnÀlizÆtiØn
With active_support mb_chars : IñTëRNâTIôNàLIZæTIøN / iÑtËrnÂtiÔnÀlizÆtiØn
لذلك، كيف يمكنني الحصول على دولية upcase
و downcase
مع روبي 1.9.1؟
تحديث
يجب أن أضيف أنني اختبرت أيضا مع activesupport من الحالية master
, 2-3-*
و 3-0-unstable
فروع القضبان في جيثب. نفس النتائج.
المحلول
تحويل الحالة يعتمد على اللغة وليس دائما رحلة ذهابا وإيابا، وهذا هو السبب لا يغطي روبي 1.9 (انظر هنا و هنا)
ال الأحجار الكريمة Unicode-util يجب معالجة احتياجاتك.
نصائح أخرى
لأي شخص يأتي من جوجل بواسطة ruby upcase utf8
:
> "your problem chars here çöğıü Iñtërnâtiônàlizætiøn".mb_chars.upcase.to_s
=> "YOUR PROBLEM CHARS HERE ÇÖĞIÜ IÑTËRNÂTIÔNÀLIZÆTIØN"
الحل هو استخدام mb_chars
.
توثيق:
تحويل الحالة هو معقدة ودل المعتمدة. لحسن الحظ، أضاف مارتن ديورست رسم الخرائط حالة يونيكود كاملة في روبي 2.4:
puts RUBY_DESCRIPTION
sd, su = "Iñtërnâtiônàlizætiøn", "IÑTËRNÂTIÔNÀLIZÆTIØN"
def ps(u, d, k); puts "%-30s: %24s / %-24s" % [k, u, d] end
ps sd.upcase, su.downcase, "Ruby 2.4 (default)"
ps sd.upcase(:ascii), su.downcase(:ascii), "Ruby 2.4 (ascii)"
ps sd.upcase(:turkic), su.downcase(:turkic), "Ruby 2.4 (turkic)"
ps sd.upcase(:lithuanian), su.downcase(:lithuanian), "Ruby 2.4 (lithuanian)"
ps "-", su.downcase(:fold), "Ruby 2.4 (fold)"
انتاج:
ruby 2.4.0dev (2016-06-24 trunk 55499) [x86_64-linux]
Ruby 2.4 (default) : IÑTËRNÂTIÔNÀLIZÆTIØN / iñtërnâtiônàlizætiøn
Ruby 2.4 (ascii) : IñTëRNâTIôNàLIZæTIøN / iÑtËrnÂtiÔnÀlizÆtiØn
Ruby 2.4 (turkic) : IÑTËRNÂTİÔNÀLİZÆTİØN / ıñtërnâtıônàlızætıøn
Ruby 2.4 (lithuanian) : IÑTËRNÂTIÔNÀLIZÆTIØN / iñtërnâtiônàlizætiøn
Ruby 2.4 (fold) : - / iñtërnâtiônàlizætiøn