根据形状计算阿拉伯字符

时间:2017-09-05 16:17:35

标签: unicode arabic

阿拉伯字符根据单词中的位置改变形状。我有一个很长的阿拉伯语文本。我想要计算文本中出现的所有不同的阿拉伯形状。但是,javascript的codePointAt()功能令我失望。

例如,这是阿拉伯语" L" => ل

这是阿拉伯语" alif" => ا

如果" alif"来自" L"总之,他们将这种形状结合在一起=> لا

现在javascripts codesPointAt()在输出字母的unicode数之前分隔单词的所有字母。因此,它将لا视为不同的字符,这不是我想要的。

我使用PHP作为服务器端脚本。据我所知,它没有unicode功能。

之后我有什么选择?

0 个答案:

没有答案