标签: go types control-characters
我正在尝试找出这些类型的字符的术语:
\ M-C \ M-6(对应于德语“ö”) \ M-C \ M-$(对应于德语“ä”) \ M-C \ M ^ _(对应于德语“ß”)
\ M-C \ M-6(对应于德语“ö”)
\ M-C \ M-$(对应于德语“ä”)
\ M-C \ M ^ _(对应于德语“ß”)
我想知道这些输出的术语,以便我可以轻松地将它们转换为实际在golang中的utf-8字符,而不必为遇到的每个输出创建映射。
这些术语是什么? unicode?在golang中将这些“字符”转换为其实际可读的字符的最佳方法是什么?
答案 0 :(得分:1)
它是UTF-8编码文本的vis编码。
这里是一个示例:
符文ö的UTF-8编码(以字节为单位)为[0303, 0266]。
ö
[0303, 0266]
vis将字节0303编码为字节\M-C,将字节0266编码为字节\M-6。
0303
\M-C
0266
\M-6
将两个编码级别放在一起,符文ö被编码为字节\M-C\M-6。
\M-C\M-6
您可以使用man page上的文档编写解码器,也可以搜索解码包。 Go标准库不包含此类解码器。