如何真正计算UTF-8字符以及具有不同字符长度的表情符号和特殊字符?

时间:2018-11-12 21:43:06

标签: javascript php unicode utf

我只想问一个非常令人困惑的问题,并获得有关其工作原理的基本答案,基本上我的问题是,当我在JavaScript和PHP中计算符号和表情符号的字符长度时,就像‍❤️‍‍一样,它出现了11个字符而不是我认为其“真实长度”为1。

我希望PHP和JavaScript的代码可以简单地计算出人类对于计算机可读的每个字符(如果有意义)所看到的“真实长度”,因此所有UTF-8符号/字符和表情符号。 / p>

我已经尝试过使用strlen,但是它只计算字节,而不是我认为的字符。 我也尝试过mb_strlen,但这没有计算表情符号的真实长度。

谢谢,我也希望能对这种编码/ Unicode系统如何适用于不同长度的字符进行简单的解释,同时还要考虑其他语言(例如法国/希伯来语。

干杯!

0 个答案:

没有答案