我有一个MySQL数据库,其中包括英文和阿拉伯文书籍,我正在使用 PHP类,可以自动将阿拉伯文本音译为拉丁文。

我希望我的输出HTML看起来像这样:

<h3>A book</h3>
<h3>كتاب <em>(kitaab)</em></h3>
<h3>Another book</h3>

PHP是否有办法根据其中使用的Unicode字符和字形确定字符串的语言?我想要得到这样的东西:

$Ar = new Arabic('EnTransliteration');
while ($item = mysql_fetch_array($results)) {
    ...
    if (some test to see if $item['item_title'] has Arabic glyphs in it) {
      echo "<h3>$item[item_title] <em>(" . $Ar->ar2en($item['item_title']) . ")</em></h3>";
    } else {
      echo "<h3>$item[item_title]</h3>";
    }
    ...
}

幸运的是,在输入拉丁字符时,类不会窒息,所以理论上我可以通过转换发送每个结果,但这似乎是浪费处理。

谢谢!

修改 我还没有找到检查字形或字符的方法。我想我可以将所有阿拉伯字符放在一个数组中,并检查数组中的任何内容是否与字符串的一部分匹配......

然而,我确实找到了一个可能最终可行的临时解决方案。无论语言如何,它都会通过转换放置每个标题,但只有在字符串发生更改时才输出括号音译:

while ($item = mysql_fetch_array($mysql_results)) {
    $transliterate = trim(strtolower($Ar->ar2en($item['item_title'])));
    $item_title = (strtolower($item['item_title']) == $transliterate) ? $item['item_title'] : $item['item_title'] . " <em>($transliterate)</em>";

    echo "<h3>$item_title</h3>";
}
有帮助吗?

解决方案

这应该这样做:

preg_match("/\p{Arabic}/u", $item['item_title'])

如果你愿意的话,你可以让正则表达式更复杂一点,但我认为你真的不需要。

\ p 转义序列允许您根据其Unicode属性选择字符(当 u 模式修饰符

PHP手册提到:“扩展属性,例如”希腊语“或“InMusicalSymbols”或“InMusicalSymbols” PCRE不支持。“但那不再完全正确。 PCRE 6.5版增加了对脚本名称的支持

其他提示

这是一个用于阿拉伯字符集自动检测的PHP开源类:

http://www.ar-php.com/php /arabic/index.html#ArCharsetD

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top