如何计算印度语脚本泰卢固语字符

时间:2013-05-12 16:29:08

标签: javascript count character

我有一些JavaScript可以计算文本框中的字符总数。这对英语很好,但是当我键入泰卢固语脚本时,它会显示错误的计数。例如,

Anil = 4
అనిల్ = 4

అనిల్只是泰卢固语脚本的三个字母。我怎样才能准确统计指标脚本字符?

1 个答案:

答案 0 :(得分:3)

我对泰卢固语一无所知,所以以下内容可能完全错误。让我知道。

"అనిల్".split("")为我打印["అ", "న", "ి", "ల", "్"]。字符#2和#4似乎是组合标记而不是字母。我们只想计算实际的字母,所以让我们删除http://www.unicode.org/Public/UNIDATA/UnicodeData.txt中未被称为泰卢固语字母的所有内容并计算其余内容:

str = "అనిల్"
len = str.replace(/[^\u0C05-\u0C39\u0C58-\u0C61]/g, '').length

按预期返回“3”。