阿拉伯字符根据单词中的位置改变形状。我有一个很长的阿拉伯语文本。我想要计算文本中出现的所有不同的阿拉伯形状。但是,javascript的codePointAt()功能令我失望。
例如,这是阿拉伯语" L" => ل
这是阿拉伯语" alif" => ا
如果" alif"来自" L"总之,他们将这种形状结合在一起=> لا
现在javascripts codesPointAt()在输出字母的unicode数之前分隔单词的所有字母。因此,它将ل
和ا
视为不同的字符,这不是我想要的。
我使用PHP作为服务器端脚本。据我所知,它没有unicode功能。
之后我有什么选择?