python获取unicode字符串大小

时间:2011-11-08 20:11:21

标签: python utf-8 binaryfiles

我有一个二进制文件。该文件包含UTF-8字符串。此外,保证这个字符串只是一个单词。 在python中,如何获得此字符串中的字母数?

让我们说,我打开这个文件并读取字节:

bytes = open("1.dat", "rb").read()

接下来我要做些什么来找出UTF-8字符串的长度(字母,而不是字节)?

1 个答案:

答案 0 :(得分:34)

unicode_string = bytes.decode("utf-8")
print len(unicode_string)