我正在研究古兰经应用程序。我有古兰经的文本文件(UTF-8
)(阿拉伯语)。我想从古兰经中搜索我的阿拉伯语单词。我想在没有Aarabs的情况下写一个古兰经的阿拉伯语单词,例如Zaber,Zair,shud,Mud和Paish。
Aarabs基本上是阿拉伯语元音。
Arabic Aarabs detail
以下是从名为ArrayList
的{{1}}搜索英语单词的代码。但对于阿拉伯语而言,它没有回复正确的词语。
testingarray
答案 0 :(得分:1)
这里是Arabic set table of the Unicode,使用正则表达式来过滤这样复杂的文本会更容易。
这是用PHP删除短元音的一个例子(我不是java程序员)
text.preg_replace("/[\x{064B}-\x{065F}]/u","")
贵族古兰经中还有更多其他元音可能需要添加其范围。
为了更准确,您可能需要Normalize the Arabic text。