我有一个中文字符串:
x = "你好"
我想循环遍历它并对其中的每个角色做一些事情,例如:
for i, len := 0, len(x); i < len; i++ {
foo( x[i] ) // do sth.
}
我发现len(x)
会返回6
而不是2
,之后我发现方法RuneCountInString
将返回字符串的实际长度,但我仍然不知道如何循环使x[i]
得到正确的字符,例如x[0] == '你'
..
由于
答案 0 :(得分:29)
使用range
。
x = "你好"
for _, c := range x {
// do something with c
}
如果您想要随机访问,则需要使用代码单元索引而不是字符索引。幸运的是,没有充分的理由需要字符索引,因此代码单元索引很好。
大多数语言都有完全相同的问题。例如,Java和C#使用UTF-16,它也是一种可变长度编码(但有些人假装它不是)。
有关Go使用UTF-8的原因的详细信息,请参阅UTF-8 Manifesto。