如何在Go中循环使用UTF-8字符串?

时间:2012-10-05 05:44:56

标签: go

我有一个中文字符串:

x = "你好"

我想循环遍历它并对其中的每个角色做一些事情,例如:

for i, len := 0, len(x); i < len; i++ {
    foo( x[i] ) // do sth.
}

我发现len(x)会返回6而不是2,之后我发现方法RuneCountInString将返回字符串的实际长度,但我仍然不知道如何循环使x[i]得到正确的字符,例如x[0] == '你' ..

由于

1 个答案:

答案 0 :(得分:29)

使用range

x = "你好"
for _, c := range x {
    // do something with c
}

如果您想要随机访问,则需要使用代码单元索引而不是字符索引。幸运的是,没有充分的理由需要字符索引,因此代码单元索引很好。

大多数语言都有完全相同的问题。例如,Java和C#使用UTF-16,它也是一种可变长度编码(但有些人假装它不是)。

有关Go使用UTF-8的原因的详细信息,请参阅UTF-8 Manifesto