搜索从阿拉伯文本文件的阿拉伯词

时间:2013-12-24 12:46:05

标签: android regex string search arabic

我正在研究古兰经应用程序。我有古兰经的文本文件(UTF-8)(阿拉伯语)。我想从古兰经中搜索我的阿拉伯语单词。我想在没有Aarabs的情况下写一个古兰经的阿拉伯语单词,例如Zaber,Zair,shud,Mud和Paish。 Aarabs基本上是阿拉伯语元音。 Arabic Aarabs detail

以下是从名为ArrayList的{​​{1}}搜索英语单词的代码。但对于阿拉伯语而言,它没有回复正确的词语。

testingarray

1 个答案:

答案 0 :(得分:1)

这里是Arabic set table of the Unicode,使用正则表达式来过滤这样复杂的文本会更容易。

这是用PHP删除短元音的一个例子(我不是java程序员)

text.preg_replace("/[\x{064B}-\x{065F}]/u","")

贵族古兰经中还有更多其他元音可能需要添加其范围。

为了更准确,您可能需要Normalize the Arabic text