Question

我在文件中有一个unicodestring®。我想用Python读取它，将其转换为位，然后返回到unicode并写入新文件。如果我创建一个变量test_unicode = "®"并使用它，它就可以工作。但是，如果我从文件中读取此文件 - 我会得到一些随机的东西（尝试过错误=替换，反斜杠，放弃）。这是我的剧本：

def frombits(bits):
    chars = []
    for b in range(int(len(bits) / 8)):
        byte = bits[b*8:(b+1)*8]
        chars.append(chr(int(''.join([str(bit) for bit in byte]), 2)))
    return ''.join(chars)

bit_list = ''
with open('uni.txt', "r", encoding='utf-8', errors='replace') as f:
    byte = f.read(1)
    while(byte):
        bit_list+='{0:08b}'.format(ord(byte))
        byte=f.read(1)

test_unicode = '®'
test_unicode_bit_list = '{0:08b}'.format(ord(test_unicode))

print(bit_list)
print(test_unicode_bit_list)

test_unicode = ''.join(frombits(test_unicode_bit_list))
read_unicode = ''.join(frombits(bit_list))

print(test_unicode.encode("utf-8"))
print(read_unicode.encode("utf-8"))

f = open("uni_test.txt", 'wb')
f.write(test_unicode.encode("utf-8"))
f = open("uni_read.txt", 'wb')
f.write(read_unicode.encode("utf-8"))

如果我使用®创建一个文件uni.txt并运行此脚本，最后我得到2个文件（第一个使用变量test_unicode，第二个使用从uni.txt读取的值）：

uni_test.txt ---＆gt; ®

uni_read.txt ---＆gt; YY

如何正确执行此操作“读取 - 转换为位 - 转换为unicode - 写入”过程？谢谢！

Answer 1

使用open(filename, 'rb')打开文件以读取字节数，然后使用适当的编码

保存

在Python中从文件读取和写入unicode

1 个答案: