我有一些JavaScript可以计算文本框中的字符总数。这对英语很好,但是当我键入泰卢固语脚本时,它会显示错误的计数。例如,
Anil = 4
అనిల్ = 4
但అనిల్
只是泰卢固语脚本的三个字母。我怎样才能准确统计指标脚本字符?
答案 0 :(得分:3)
我对泰卢固语一无所知,所以以下内容可能完全错误。让我知道。
"అనిల్".split("")
为我打印["అ", "న", "ి", "ల", "్"]
。字符#2和#4似乎是组合标记而不是字母。我们只想计算实际的字母,所以让我们删除http://www.unicode.org/Public/UNIDATA/UnicodeData.txt中未被称为泰卢固语字母的所有内容并计算其余内容:
str = "అనిల్"
len = str.replace(/[^\u0C05-\u0C39\u0C58-\u0C61]/g, '').length
按预期返回“3”。