红宝石 1.9:如何正确地大写和小写多字节字符串?
-
19-09-2019 - |
题
所以matz决定保留 upcase
和 downcase
仅限于 /[A-Z]/i
在红宝石 1.9.1 中。
ActiveSupport::Multibyte
长期以来,在 ruby 1.8.x 中都有很棒的 i18n 案例抖动 String#mb_chars
.
然而,当在 ruby 1.9.1 下尝试时,它似乎不起作用。这是我编写的一个简单的测试脚本,以及我得到的输出:
$ cat test.rb
# encoding: UTF-8
puts("@ #{RUBY_VERSION} " + (__ENCODING__ rescue $KCODE).to_s)
sd, su = "Iñtërnâtiônàlizætiøn", "IÑTËRNÂTIÔNÀLIZÆTIØN"
def ps(u, d, k); puts "%-30s: %24s / %-24s" % [k, u, d] end
ps sd.upcase, su.downcase, "Plain ruby"
require 'rubygems'; require 'active_support'
ps sd.upcase, su.downcase, "With active_support"
ps sd.mb_chars.upcase.to_s, su.mb_chars.downcase.to_s, "With active_support mb_chars"
$ ruby -KU test.rb
@ 1.8.7 UTF8
Plain ruby : IñTëRNâTIôNàLIZæTIøN / iÑtËrnÂtiÔnÀlizÆtiØn
With active_support : IñTëRNâTIôNàLIZæTIøN / iÑtËrnÂtiÔnÀlizÆtiØn
With active_support mb_chars : IÑTËRNÂTIÔNÀLIZÆTIØN / iñtërnâtiônàlizætiøn
$ ruby1.9 test.rb
@ 1.9.1 UTF-8
Plain ruby : IñTëRNâTIôNàLIZæTIøN / iÑtËrnÂtiÔnÀlizÆtiØn
With active_support : IñTëRNâTIôNàLIZæTIøN / iÑtËrnÂtiÔnÀlizÆtiØn
With active_support mb_chars : IñTëRNâTIôNàLIZæTIøN / iÑtËrnÂtiÔnÀlizÆtiØn
那么,我该如何走向国际化呢? upcase
和 downcase
与红宝石1.9.1?
更新
我应该补充一点,我还使用当前的 ActiveSupport 进行了测试 master
, 2-3-*
和 3-0-unstable
GitHub 上的 Rails 分支。结果相同。
解决方案
大小写转换取决于语言环境,并且并不总是往返,这就是为什么 Ruby 1.9 没有涵盖它(请参阅 这里 和 这里)
这 unicode-util gem 应该满足您的需求。
其他提示
对于任何来自 Google 的人 ruby upcase utf8
:
> "your problem chars here çöğıü Iñtërnâtiônàlizætiøn".mb_chars.upcase.to_s
=> "YOUR PROBLEM CHARS HERE ÇÖĞIÜ IÑTËRNÂTIÔNÀLIZÆTIØN"
解决方案是使用 mb_chars
.
文档:
Case变换是复杂的和区域设置相关。幸运的是,马丁·德斯特添加完整的Unicode大小写映射在Ruby中2.4:
puts RUBY_DESCRIPTION
sd, su = "Iñtërnâtiônàlizætiøn", "IÑTËRNÂTIÔNÀLIZÆTIØN"
def ps(u, d, k); puts "%-30s: %24s / %-24s" % [k, u, d] end
ps sd.upcase, su.downcase, "Ruby 2.4 (default)"
ps sd.upcase(:ascii), su.downcase(:ascii), "Ruby 2.4 (ascii)"
ps sd.upcase(:turkic), su.downcase(:turkic), "Ruby 2.4 (turkic)"
ps sd.upcase(:lithuanian), su.downcase(:lithuanian), "Ruby 2.4 (lithuanian)"
ps "-", su.downcase(:fold), "Ruby 2.4 (fold)"
输出:
ruby 2.4.0dev (2016-06-24 trunk 55499) [x86_64-linux]
Ruby 2.4 (default) : IÑTËRNÂTIÔNÀLIZÆTIØN / iñtërnâtiônàlizætiøn
Ruby 2.4 (ascii) : IñTëRNâTIôNàLIZæTIøN / iÑtËrnÂtiÔnÀlizÆtiØn
Ruby 2.4 (turkic) : IÑTËRNÂTİÔNÀLİZÆTİØN / ıñtërnâtıônàlızætıøn
Ruby 2.4 (lithuanian) : IÑTËRNÂTIÔNÀLIZÆTIØN / iñtërnâtiônàlizætiøn
Ruby 2.4 (fold) : - / iñtërnâtiônàlizætiøn
不隶属于 StackOverflow