处理阿拉伯语文本以进行音译

时间:2014-07-17 05:08:33

标签: php nlp arabic stanford-nlp

我使用http://www.ar-php.org/en_index-php-arabic.html库将阿拉伯语用于英语和英语到阿拉伯语的音译。

对于从网络上复制的简单英文或阿拉伯文字,它可以正常使用。

但对于使用robert_boldrobert_regular_0字体编写的英文文本,如下所示:

Words

当我转换它时,它会给我不支持的文字,如:

ال ‘؟ س[
كير[ ’[ ت
شو ’\ ن
به ’; س
؟ م[ن
س ال@اناه

当我转换简单的英文文本时,它会提供所有支持的阿拉伯字符。

我不是阿拉伯本土居民。

任何改善我的系统的建议都会很明显。

1 个答案:

答案 0 :(得分:1)

我相信你的问题在于编辑你的文本' robert_bold'字体。 它似乎使用了标准之外的其他一些字符,因此您还需要将这些字符添加到音译库中。

看看你提到的一句话 - 舒'联合国。第二个' u'图中的字母在它上面有一条线。因此,它超出正常范围的字符,因此 - 在该库中没有音译。