我有一个MySQL数据库,其中包含英文和阿拉伯文书籍,我使用的PHP class可以自动将阿拉伯文字音译成拉丁文。
我希望我的输出HTML看起来像这样:
<h3>A book</h3>
<h3>كتاب <em>(kitaab)</em></h3>
<h3>Another book</h3>
PHP是否有办法根据其中使用的Unicode字符和字形确定字符串的语言?我想要得到这样的东西:
$Ar = new Arabic('EnTransliteration');
while ($item = mysql_fetch_array($results)) {
...
if (some test to see if $item['item_title'] has Arabic glyphs in it) {
echo "<h3>$item[item_title] <em>(" . $Ar->ar2en($item['item_title']) . ")</em></h3>";
} else {
echo "<h3>$item[item_title]</h3>";
}
...
}
幸运的是,在输入拉丁字符时,类不会窒息,所以理论上我可以通过转换发送每个结果,但这似乎是浪费处理。
谢谢!
修改 我还没有找到检查字形或字符的方法。我想我可以将所有阿拉伯字符放在一个数组中,并检查数组中的任何内容是否与字符串的一部分匹配......
然而,我确实找到了一个可能最终可行的临时解决方案。无论语言如何,它都会通过转换放置每个标题,但只有在字符串发生更改时才输出括号音译:while ($item = mysql_fetch_array($mysql_results)) {
$transliterate = trim(strtolower($Ar->ar2en($item['item_title'])));
$item_title = (strtolower($item['item_title']) == $transliterate) ? $item['item_title'] : $item['item_title'] . " <em>($transliterate)</em>";
echo "<h3>$item_title</h3>";
}
答案 0 :(得分:7)
这应该这样做:
preg_match("/\p{Arabic}/u", $item['item_title'])
如果你愿意的话,你可以让正则表达式更复杂一点,但我认为你真的不需要。
\p
escape sequence允许您根据Unicode属性选择字符(使用u
pattern modifier时)。
PHP手册提到:“PCRE不支持”希腊语“或”InMusicalSymbols“等扩展属性。”但那不再完全正确。 PCRE release 6.5 added support for script names
答案 1 :(得分:0)
这是一个用于阿拉伯字符集自动检测的PHP开源类: