如何从golang中的一串符文中获取子串?

时间:2015-02-25 12:08:31

标签: unicode go rune

我发现了这个,https://groups.google.com/forum/#!topic/golang-nuts/YyKlLwuWt3w但据我所知,这些解决方案并不适用于我。

如果你使用将字符串视为切片(str[:20])的方法,它会在字符中间断开,我们得到“ال ”。

编辑:我相信我可以编写一个函数并以3的倍数执行,因为符文是int32(32位/(8位/字节))。我首先要检查是否有符文。

4 个答案:

答案 0 :(得分:18)

首先将其转换为符文切片,切片,然后将结果转换回来:

string([]rune(str)[:20])

答案 1 :(得分:6)

您可以获取UTF-8字符串的子字符串,而无需分配额外的内存(您不必将其转换为rune切片):

func substring(s string, start int, end int) string {
    start_str_idx := 0
    i := 0
    for j := range s {
        if i == start {
            start_str_idx = j
        }
        if i == end {
            return s[start_str_idx:j]
        }
        i++
    }
    return s[start_str_idx:]
}

func main() {
    s := "世界 Hello"
    fmt.Println(substring(s, 0, 1)) // 世
    fmt.Println(substring(s, 1, 5)) // 界 He
    fmt.Println(substring(s, 3, 8)) // Hello
}

答案 2 :(得分:0)

这是基于符文技巧的基于长度的实现:

func substr(input string, start int, length int) string {
    asRunes := []rune(input)

    if start >= len(asRunes) {
        return ""
    }

    if start+length > len(asRunes) {
        length = len(asRunes) - start
    }

    return string(asRunes[start : start+length])
}

答案 3 :(得分:0)

如果你不介意实验包,你可以使用这个:

package main
import "golang.org/x/exp/utf8string"

func main() {
   a := utf8string.NewString("ÄÅàâäåçèéêëìîïü")
   s := a.Slice(1, 3)
   println(s == "Åà")
}

https://pkg.go.dev/golang.org/x/exp/utf8string