标签: python utf-8 binaryfiles
我有一个二进制文件。该文件包含UTF-8字符串。此外,保证这个字符串只是一个单词。 在python中,如何获得此字符串中的字母数?
让我们说,我打开这个文件并读取字节:
bytes = open("1.dat", "rb").read()
接下来我要做些什么来找出UTF-8字符串的长度(字母,而不是字节)?
答案 0 :(得分:34)
unicode_string = bytes.decode("utf-8") print len(unicode_string)