题
我有一个MySQL数据库,其中包括英文和阿拉伯文书籍,我正在使用 PHP类,可以自动将阿拉伯文本音译为拉丁文。
我希望我的输出HTML看起来像这样:
<h3>A book</h3>
<h3>كتاب <em>(kitaab)</em></h3>
<h3>Another book</h3>
PHP是否有办法根据其中使用的Unicode字符和字形确定字符串的语言?我想要得到这样的东西:
$Ar = new Arabic('EnTransliteration');
while ($item = mysql_fetch_array($results)) {
...
if (some test to see if $item['item_title'] has Arabic glyphs in it) {
echo "<h3>$item[item_title] <em>(" . $Ar->ar2en($item['item_title']) . ")</em></h3>";
} else {
echo "<h3>$item[item_title]</h3>";
}
...
}
幸运的是,在输入拉丁字符时,类不会窒息,所以理论上我可以通过转换发送每个结果,但这似乎是浪费处理。
谢谢!
修改强> 我还没有找到检查字形或字符的方法。我想我可以将所有阿拉伯字符放在一个数组中,并检查数组中的任何内容是否与字符串的一部分匹配......
然而,我确实找到了一个可能最终可行的临时解决方案。无论语言如何,它都会通过转换放置每个标题,但只有在字符串发生更改时才输出括号音译:while ($item = mysql_fetch_array($mysql_results)) {
$transliterate = trim(strtolower($Ar->ar2en($item['item_title'])));
$item_title = (strtolower($item['item_title']) == $transliterate) ? $item['item_title'] : $item['item_title'] . " <em>($transliterate)</em>";
echo "<h3>$item_title</h3>";
}
解决方案
这应该这样做:
preg_match("/\p{Arabic}/u", $item['item_title'])
如果你愿意的话,你可以让正则表达式更复杂一点,但我认为你真的不需要。
\ p
转义序列允许您根据其Unicode属性选择字符(当 u
模式修饰符。
PHP手册提到:“扩展属性,例如”希腊语“或“InMusicalSymbols”或“InMusicalSymbols” PCRE不支持。“但那不再完全正确。 PCRE 6.5版增加了对脚本名称的支持。
其他提示
这是一个用于阿拉伯字符集自动检测的PHP开源类:
不隶属于 StackOverflow